Estás leyendo la publicación: Modelo de texto a imagen, traducción de idiomas y otros aspectos destacados del evento de IA de Google
El miércoles, Google organizó su primer evento AI@ para mostrar su último trabajo en IA. El evento se centró en los nuevos desarrollos, así como en las primeras investigaciones de Google AI y los equipos de investigación en áreas de cambio climático, comprensión del lenguaje natural, accesibilidad, atención médica y creatividad.
Además, el evento se centró en gran medida en los esfuerzos de Google por crear una IA responsable para priorizar la seguridad y la privacidad de las personas en medio de los rápidos avances de la IA.
1/ Del evento AI@ de hoy: anunciamos que nuestro modelo de texto a imagen Imagen llegará pronto a AI Test Kitchen. Y por primera vez, compartimos un video de súper resolución generado por IA usando Phenaki para generar videos largos y coherentes a partir de indicaciones de texto e Imagen Video para aumentar la calidad. pic.twitter.com/WofU5J5eZV
– Sundar Pichai (@sundarpichai) 2 de noviembre de 2022
La innovación de productos de Google se dividió en tres categorías: IA para el bien social, IA para la creatividad e IA para la inclusión lingüística.
El video completo del evento se puede acceder aquí.
Puntos clave
- Google anunció Floodhub, una plataforma que brinda alertas de inundaciones al público en general. Desde 2018, Google ha estado involucrado en la aplicación de IA para el pronóstico de inundaciones, alertando a los usuarios a través de la búsqueda de Google y Maps. Pero ahora, utilizando nuevos avances en IA, planea expandir su cobertura a 18 nuevos países. La nueva plataforma utilizará imágenes satelitales e inteligencia artificial para mapear ríos con precisión, modelar qué áreas se inundarán y enviar información oportuna.
- La tecnología de imágenes satelitales de Google también entrenará modelos de IA para identificar y rastrear incendios forestales en tiempo real, dando así un paso adelante para abordar el impacto del cambio climático. El sistema de seguimiento de incendios forestales podrá predecir cómo evolucionará y se propagará el fuego, lo que ayudará a las personas y a los bomberos a tomar medidas oportunas contra él.
Puede encontrar más información sobre la naturaleza precisa de los modelos de IA creados por los investigadores de Google y su trabajo con las autoridades de bomberos aquí.
- Aprovechar la IA para brindar atención médica equitativa y de alta calidad en todo el mundo también ha sido parte de la agenda de desarrollo de Google. En asociación con Northwestern Medicine, la compañía está desarrollando un dispositivo ultrasónico de bajo costo destinado a ayudar a las enfermeras y parteras en regiones sin ecografistas. La aplicación de IA ayudará a los trabajadores de la salud a recopilar e interpretar imágenes de ultrasonido y brindar atención oportuna al identificar problemas al principio del embarazo.
Google también planea expandir su alcance en sus esfuerzos continuos para aumentar la accesibilidad a la atención médica. Aumentará la asociación con los cuidadores y las agencias de salud pública para brindar acceso a la detección de la retinopatía diabética a través de su herramienta de evaluación automatizada de enfermedades de la retina (ARDA).
Además, en sus esfuerzos por desbloquear el acceso a la atención médica para cualquier persona con un teléfono inteligente, Google está trabajando en el control de la vista, así como en herramientas de seguimiento de la frecuencia cardíaca y respiratoria.
- Google también anunció el modelo Imagen de texto a imagen, que difiere de su enfoque anterior llamado Parti. Imagen utiliza modelos de difusión para crear imágenes de alta resolución que relacionan el ruido con los datos. Este nuevo modelo de IA llegará pronto a AI Test Kitchen, una aplicación donde los usuarios pueden aprender, experimentar y dar su opinión sobre la tecnología de IA emergente de Google. También, por primera vez, reprodujo un video coherente de formato largo a partir de indicaciones de texto, utilizando Imagen Video y Phenaki, un modelo de lenguaje que convierte el texto en videos.
- El evento incluyó los últimos avances en investigación de IA basados en el modelo de lenguaje Pathways (PaLM). El sistema Minerva AI de Google se basa en PaLM y se utiliza para resolver problemas matemáticos complejos mediante razonamiento simbólico y aritmético. Google también está experimentando con la aplicación de PaLM en robótica. PaLM-SayCan es un modelo de aprendizaje de robots que combina las capacidades de lenguaje natural de PaLM con las capacidades del mundo real de los robots auxiliares.
- En el futuro, Google también planea construir un modelo que pueda admitir 1000 idiomas más hablados a través de su Iniciativa de 1000 Idiomas. La iniciativa se centrará en aumentar la representación en el entrenamiento de modelos de IA.