Investigadores del MIT y Harvard presentan modelos de lenguaje entrenados en dietas mediáticas que pueden predecir la opinión pública

Estás leyendo la publicación: Investigadores del MIT y Harvard presentan modelos de lenguaje entrenados en dietas mediáticas que pueden predecir la opinión pública

Los enfoques tradicionales basados ​​en encuestas para medir la opinión pública tienen limitaciones, pero la opinión pública refleja e influye en el comportamiento de la sociedad. Es necesario explorar las preguntas sobre hasta qué punto la IA puede comprender y adoptar actitudes basadas en el lenguaje humano. Responder a estos problemas se ha vuelto cada vez más apremiante a medida que se desarrollan grandes modelos de lenguaje y se utilizan más comúnmente, gracias a trabajos recientes como GPT3, PaLM, ChatGPT, Claude y Bard.

Un trabajo reciente del MIT y la Universidad de Harvard sigue los pasos de otros avances recientes en software de procesamiento de lenguaje natural que resumen grandes conjuntos de datos para ayudar en la toma de decisiones humanas. Presentan un nuevo método para investigar los modelos de dieta de los medios, que son modelos de lenguaje modificado que imitan las perspectivas de las subpoblaciones en función de su consumo de ciertos medios (como noticias de Internet, transmisiones de televisión o programas de radio).

El poder predictivo, la robustez para formular preguntas, la efectividad en todos los tipos de medios y la presencia de señales predictivas después de tener en cuenta la demografía se demuestran para los modelos de dieta de los medios en contextos económicos y de salud pública. Análisis adicionales muestran cómo son sensibles al nivel de atención que las personas dan a las noticias y cómo sus impactos varían según el tipo de consulta realizada.

Para anticipar cómo una subpoblación responderá a una pregunta de la encuesta, el equipo emplea un modelo computacional que ingresa una descripción de la dieta de medios de la subpoblación y la pregunta que se hace. Los modelos de opinión pública in silico se pueden usar si pueden pronosticar con precisión los resultados de las encuestas humanas. Las preguntas sobre el sentimiento público (como “¿Cómo se siente la gente acerca de la pandemia?”) y la investigación científica sobre los efectos de los medios (como “¿Cómo afecta la dieta de los medios a las percepciones de la pandemia?”) podrían verse beneficiadas por este enfoque.

🔥 Recomendado:  Los investigadores de CMU proponen GILL: un método de inteligencia artificial para fusionar LLM con modelos de codificador y decodificador de imágenes

Hay tres etapas para desarrollar un modelo para una dieta de medios:

  1. Un modelo de lenguaje se desarrolla o se usa para predecir palabras omitidas en un documento. En este trabajo, emplean principalmente BERT, un modelo previamente entrenado.
  2. La modificación del modelo de lenguaje entrenándolo en un conjunto de datos de dieta de medios incluye contenido de varios medios de comunicación que cubren un período de tiempo determinado. Los investigadores utilizan la televisión y la radio para mostrar transcripciones y noticias de Internet. Esta modificación permite que el modelo tome datos nuevos mientras actualiza simultáneamente sus representaciones internas de conocimiento.
  3. Hacer preguntas a estos modelos para ver si sus distribuciones de respuesta reflejan las de las poblaciones con diferentes patrones dietéticos en función de los medios que consumen. Analizan las respuestas a las preguntas de la encuesta consultando el modelo de dieta de los medios.

Los investigadores emplean modelos de regresión en los que (i) se utiliza para predecir (ii) para realizar pronósticos de opinión pública. La información de las encuestas proviene de encuestas estatales sobre COVID-19 y la confianza del consumidor. Finalmente, emplean el método del vecino más cercano para rastrear los conjuntos de datos de la dieta de los medios de origen de los cuales se derivaron los pronósticos para una pregunta específica de la encuesta.

La importancia de la investigación de la dieta en los medios se ve reforzada por tres cuestiones interconectadas:

  1. Exposición selectiva, o el amplio sesgo sistémico en el que las personas gravitan hacia la información que es coherente con sus ideas previas.
  2. Cámaras de eco, donde las creencias compartidas entre personas de ideas afines son amplificadas y fortalecidas por el entorno elegido.
  3. Burbujas de filtro, donde los algoritmos de selección y recomendación de contenido muestran elementos en función de las actividades pasadas de los usuarios, lo que nuevamente refuerza las visiones del mundo de los usuarios.
🔥 Recomendado:  Longitud del título y las metadescripciones de Google (actualizado en 2023)

Los modelos de la dieta de los medios podrían usarse para determinar qué grupos están recibiendo los mensajes potencialmente más peligrosos. También brindan una forma de investigar los efectos más matizados de las comunicaciones, como la variación en la resonancia causada por variaciones en la elección de palabras. Si bien esto se ha investigado en entornos de laboratorio controlados y, en menor medida, en línea, los investigadores que se centran en los efectos de los medios se han visto obstaculizados por la falta de herramientas adecuadas.

El equipo que estos modelos eventualmente se usarán para ayudar a resolver problemas del mundo real con un enfoque en las personas.