Hogar Audio ¿Por qué algunos proyectos de aprendizaje automático requieren una enorme cantidad de actores?

¿Por qué algunos proyectos de aprendizaje automático requieren una enorme cantidad de actores?

Anonim

Q:

¿Por qué algunos proyectos de aprendizaje automático requieren una enorme cantidad de actores?

UN:

Cuando piensa en el aprendizaje automático, tiende a pensar en científicos expertos en datos que trabajan en teclados en salas de computadoras. Hay un énfasis extremo en el análisis cuantitativo y los algoritmos. No hay mucho contexto inmediato en el mundo real para muchos de estos programas; al menos, eso es lo que muchos pensarían.

Sin embargo, algunos de los programas de aprendizaje automático más innovadores de la actualidad están utilizando verdaderos ejércitos de actores humanos en la calle, en las tiendas y en cualquier lugar donde puedan modelar actividades humanas básicas como caminar, trabajar o ir de compras.

Descarga gratuita: Aprendizaje automático y por qué es importante

Un artículo publicado por Tom Simonite ilustra esto muy bien con el título apropiado "Para hacer que la inteligencia artificial sea más inteligente, los humanos realizan tareas poco pagadas de Oddball".

Utilizando el ejemplo de videos cortos tomados en una tienda de comestibles Whole Foods, Simonite destaca los tipos de trabajo que ayudarán a desarrollar parte de la próxima fase del aprendizaje automático.

Esto lleva a la pregunta de por qué todas estas personas se dedican a filmarse en videos cortos y simples que documentan acciones tan rudimentarias como mover un brazo o una pierna.

La respuesta arroja algo de luz sobre dónde está el aprendizaje automático y hacia dónde va.

"Los investigadores y los emprendedores quieren ver a la inteligencia artificial entender y actuar en el mundo físico", escribe Simonite, explicando por qué él y otros están deambulando por las cámaras. “De ahí la necesidad de que los trabajadores actúen escenas en supermercados y hogares. Están generando el material de instrucción para enseñar algoritmos sobre el mundo y las personas en él ".

Como muchos expertos señalarán, algunas de las mayores fronteras del aprendizaje automático implican el procesamiento de imágenes y el procesamiento del lenguaje natural. Estos son procedimientos extremadamente cuantitativos; en otras palabras, no hay un amplio espectro de entradas como en entornos del mundo real "performantes". En cambio, los programas de aprendizaje automático están utilizando datos visuales y de audio de maneras muy específicas para construir modelos. Con el procesamiento de imágenes, está seleccionando características de un campo de visión (finito). Para PNL, está ensamblando fonemas.

Ir más allá de estas categorías de entrada específicas implica algo que usted podría llamar la "brecha de imagen y habla": al ir más allá de cosas como el procesamiento de imágenes y el reconocimiento de voz, se está moviendo a áreas donde las computadoras deben ser analíticas de diferentes maneras. Los conjuntos de entrenamiento serán fundamentalmente diferentes.

Entra en el ejército de camarógrafos. En algunos de estos nuevos proyectos de aprendizaje automático, las ideas más pequeñas de las actividades humanas son los conjuntos de capacitación. En lugar de ser entrenados para buscar características y bordes y píxeles que se componen en tareas de clasificación, las computadoras utilizan videos de entrenamiento para evaluar cómo se ven los diferentes tipos de acción.

La clave es lo que los ingenieros pueden hacer con estos datos cuando se agregan y cargan, y cuando la computadora está capacitada en ellos. Pronto verá los resultados en varios campos; por ejemplo, esto hará que la vigilancia sea extremadamente efectiva. Las computadoras podrán "ver" en el campo visual lo que la gente está haciendo, y aplicarlo a campos como marketing y ventas, o quizás, en algunos casos, trabajo de agencias gubernamentales o justicia penal.

Las ramificaciones también arrojan algo de luz sobre el debate entre el beneficio máximo y las preguntas de privacidad. Gran parte del uso de estos videos creará modelos de aprendizaje automático que funcionan para la vigilancia, pero ¿qué pasa con las personas que no quieren ser vigiladas? Cuando estos nuevos programas de aprendizaje automático se implementan en el espacio público, ¿cuáles son los derechos del individuo y dónde se dibuja esa línea?

En cualquier caso, las empresas están utilizando este tipo de recursos humanos y de video para profundizar en algunas rondas de progreso de aprendizaje automático del siguiente nivel que permitirán a las computadoras reconocer lo que sucede a su alrededor, en lugar de solo clasificar imágenes o trabajar con los fonemas de habla. Este es un desarrollo extremadamente interesante y controvertido en inteligencia artificial, y que merece su parte de atención en los medios tecnológicos y más allá.

¿Por qué algunos proyectos de aprendizaje automático requieren una enorme cantidad de actores?