Según esta nueva investigación de IA en el MIT, los modelos de aprendizaje automático entrenados con datos sintéticos pueden superar a los modelos entrenados con datos reales en algunos…

Estás leyendo la publicación: Según esta nueva investigación de IA en el MIT, los modelos de aprendizaje automático entrenados con datos sintéticos pueden superar a los modelos entrenados con datos reales en algunos…

El reconocimiento de acciones, o enseñar a una máquina a reconocer acciones humanas, tiene una amplia gama de aplicaciones potenciales. Por ejemplo, se puede usar para detectar automáticamente a los trabajadores que tropiezan y se caen en un sitio de construcción o enseñar a un robot doméstico inteligente a comprender los gestos de un usuario. Para hacer esto, se utilizan bases de datos de video masivas, que incluyen imágenes de personas que actúan de forma natural, para entrenar modelos de aprendizaje automático. Sin embargo, recopilar y etiquetar millones o miles de millones de películas es costoso y requiere mucho tiempo. Los clips a veces incluyen datos privados como números de placas o rostros de personas reales. Además, el uso de estos videos puede estar en contra de las leyes de derechos de autor y privacidad. Además, dado que muchos conjuntos de datos están en manos de empresas y no están disponibles para uso gratuito, los investigadores deben explicar por qué dichos datos de video son de acceso público en primer lugar.

Por lo tanto, los científicos están utilizando conjuntos de datos sintéticos. Estos son creados por una computadora que utiliza modelos 3D de entornos, objetos y personas del mundo real para producir rápidamente una amplia gama de imágenes de comportamientos particulares sin la posibilidad de violaciones de derechos de autor o ambigüedades morales que conlleva el uso de datos reales. Solo se han hecho intentos modestos para investigar el potencial de los datos de video sintéticos en comparación con los conjuntos de datos del mundo real. Sin embargo, existen ciertas preocupaciones con respecto al rendimiento de los modelos entrenados con datos sintéticos en lugar de datos reales.

🔥 Recomendado:  Cómo crear & Verificar una cuenta PayPal en India [The Definitive Guide]

Un grupo de investigadores del MIT, el MIT-IBM Watson AI Lab y la Universidad de Boston crearon un conjunto de datos sintéticos de 150 000 videoclips que registraron una variedad de acciones humanas para responder a tales consultas. Para entrenar modelos de aprendizaje automático, se utilizó este conjunto de datos. Luego, los investigadores probaron la capacidad de su modelo para aprender a distinguir acciones en videos del mundo real utilizando seis conjuntos de datos diferentes de videos. Para videos con menos objetos de fondo, los investigadores descubrieron que los modelos enseñados sintéticamente superaron a los entrenados con datos reales. La investigación también se presentará en la Conferencia de sistemas de procesamiento de información neuronal.

El objetivo principal de la investigación es sustituir el preentrenamiento de datos sintéticos por el preentrenamiento de datos reales. Los investigadores destacan que aunque realizar una acción en datos sintéticos tiene un coste, una vez realizada cualquiera puede producir una infinidad de fotografías o películas alterando la actitud, la iluminación, etc.

Los investigadores comenzaron reuniendo tres conjuntos de datos disponibles públicamente de videoclips artificiales que capturaban acciones humanas para desarrollar el conjunto de datos sintético. Las 150 categorías de acción en su conjunto de datos, denominado Preentrenamiento y Transferencia de Acción Sintética (SynAPT), cada una presentaba 1,000 videos. Usaron el conjunto de datos para entrenar previamente tres modelos de aprendizaje automático para reconocer los actos después de que se crearon. El modelo preentrenado usa los parámetros descubiertos previamente para aprender una nueva tarea con un nuevo conjunto de datos de manera más rápida y exitosa. En este paso, se entrenó un modelo para una sola tarea para darle una ventaja en el aprendizaje de tareas adicionales mediante la aplicación de conocimientos previos.

🔥 Recomendado:  Olvídese de Twitter: esta aplicación de redes sociales tiene ChatGPT incorporado

Los investigadores se sorprendieron al descubrir que los tres modelos sintéticos superaban a los modelos entrenados con clips de video reales en cuatro de los seis conjuntos de datos del mundo real cuando probaron los modelos previamente entrenados usando esos conjuntos de datos. Los conjuntos de datos compuestos por videos con “sesgo de objeto de escena bajo” (clips de video en los que el modelo no puede reconocer la acción al mirar el fondo u otros objetos en la escena, sino que debe concentrarse en la acción en sí) tuvieron las tasas de precisión más notables. .

Los investigadores tienen la intención de ampliar estos hallazgos en trabajos futuros mediante la incorporación de más clases de acción y plataformas de video más sintéticas. En última instancia, esperan lograr una cartera de modelos que hayan sido entrenados previamente utilizando datos sintéticos y tengan un rendimiento extremadamente cercano o incluso mejor que los modelos que ya existen en la literatura. Para mejorar el rendimiento de los modelos, el equipo también planea integrar sus esfuerzos con la investigación que apunta a producir películas sintéticas más precisas y realistas.

La investigación futura podría hacer un mejor uso de los conjuntos de datos sintéticos, lo que permitiría que los modelos se desempeñen con mayor precisión en las tareas reales. Para reducir algunas de las preocupaciones éticas, de privacidad y de derechos de autor asociadas con el uso de conjuntos de datos reales, también puede ayudar a los investigadores a determinar qué aplicaciones de aprendizaje automático son las más adecuadas para el entrenamiento con datos sintéticos.

Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘¿Qué tan transferibles son las representaciones de video basadas en datos sintéticos?‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel y artículo de referencia.

🔥 Recomendado:  Qué diferencia a FXGM ZA de los demás

Por favor no olvides unirte Nuestro subreddit de ML

Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools