Q:
¿Cómo pueden las nuevas capacidades de aprendizaje automático permitir la extracción de documentos de stock para datos financieros?
UN:Una de las nuevas y emocionantes fronteras del aprendizaje automático y la inteligencia artificial es que los científicos e ingenieros se están embarcando en varias formas de usar tipos completamente nuevos de recursos para predecir el movimiento de las existencias y los resultados de la inversión. Este es un tremendo cambio en el mundo financiero, y revolucionará las estrategias de inversión de una manera muy profunda.
Una de las ideas básicas para expandir este tipo de investigación de valores es la lingüística computacional, que implica el modelado del lenguaje natural. Los expertos están investigando cómo usar documentos de texto, desde presentaciones de la SEC hasta cartas de accionistas a otros recursos periféricos basados en texto, para aumentar o ajustar el análisis de existencias o desarrollar análisis completamente nuevos.
Descarga gratuita: Aprendizaje automático y por qué es importante |
El descargo de responsabilidad importante es que todo esto solo es factible a través de nuevos avances en redes neuronales, aprendizaje automático y análisis del lenguaje natural. Antes de la llegada de ML / AI, las tecnologías informáticas utilizaban principalmente la programación lineal para "leer" las entradas. Los documentos de texto estaban demasiado desestructurados para ser útiles. Pero con el progreso realizado en el análisis del lenguaje natural en los últimos años, los científicos están descubriendo que es posible "extraer" el lenguaje natural para obtener resultados cuantificables o, en otras palabras, resultados que se puedan calcular de alguna manera.
Algunas de las mejores pruebas y ejemplos más útiles de esto provienen de varias disertaciones y trabajos de doctorado disponibles en la web. En un artículo, "Aplicaciones del aprendizaje automático y la lingüística computacional en la economía financiera", publicado en abril de 2016, Lili Gao explica de manera competente los procesos relevantes específicos para la extracción de registros corporativos de la SEC, llamadas a los accionistas y mensajes en las redes sociales.
"Extraer señales significativas de datos de texto no estructurados y de alta dimensión no es una tarea fácil", escribe Gao. "Sin embargo, con el desarrollo del aprendizaje automático y las técnicas lingüísticas computacionales, se pueden realizar tareas de procesamiento y análisis estadístico de documentos de texto, y muchas aplicaciones de análisis estadístico de texto en ciencias sociales han demostrado ser exitosas". De la discusión de Gao sobre el modelado y la calibración en el resumen, todo el documento desarrollado muestra cómo funciona en detalle parte de este tipo de análisis.
Otras fuentes para proyectos activos incluyen páginas como este resumen del proyecto GitHub, y este recurso IEEE que habla específicamente sobre cómo obtener información financiera valiosa del "análisis de sentimientos de Twitter".
La conclusión es que el uso de estos nuevos modelos de PNL está impulsando la innovación rápida en el uso de todo tipo de documentos de texto, no solo para el análisis financiero, sino también para otros tipos de descubrimiento de vanguardia, difuminando esa línea tradicionalmente establecida entre "lenguaje" y "datos."