Estás leyendo la publicación: Meta AI presenta el primer modelo capaz de verificar automáticamente cientos de miles de citas a la vez
Wikipedia es la enciclopedia más utilizada de todos los tiempos para investigación, información básica y otros fines. Tiene más de 6,5 millones de artículos. La cuestión de cómo verificar la exactitud de la información siempre permanece en segundo plano, a pesar de lo fácilmente accesible que es. Aunque Wikipedia es colaborativa, lo que exige que se verifiquen los hechos, todas las citas, afirmaciones contenciosas e información sobre personas vivas deben incluir una cita. Sin embargo, mantenerse al día con los más de 17 000 artículos nuevos que se suben cada mes es un desafío para los voluntarios debido a la cantidad cada vez mayor de material disponible. El descubrimiento de que un adolescente estadounidense escribió 27 000 entradas en un idioma que no hablaba en 2020 es un incidente que demuestra que las enciclopedias en línea no son una fuente perfecta de información. Aunque ocasionalmente ocurren intentos maliciosos de editar artículos de Wikipedia, los errores de hecho son típicamente el resultado de una persona bien intencionada que comete un error. Este es el problema que busca resolver Meta. Un equipo de investigación de Meta ha desarrollado Sphere, el primer modelo que escanea automáticamente millones de citas a la vez para determinar si realmente respaldan las afirmaciones relacionadas. El equipo creó un impresionante conjunto de datos para esta tarea que consta de 134 millones de páginas web públicas; era un orden de magnitud más grande y sustancialmente más complejo que cualquier cosa utilizada anteriormente para este tipo de investigación. Los editores pueden evaluar manualmente los casos que tienen más probabilidades de ser problemáticos sin tener que rastrear miles de afirmaciones citadas correctamente porque llama la atención sobre las citas que pueden ser cuestionables. El modelo sugiere una fuente más confiable e identifica el texto que respalda el argumento si una cita parece irrelevante.
El objetivo del equipo es crear una plataforma que ayude a los editores de Wikipedia a identificar sistemáticamente problemas de citas y editar en masa el texto del artículo asociado. El equipo cree que al enseñar a las máquinas a comprender la relación entre las secciones de texto difíciles y los artículos que mencionan, su modelo puede ayudar a la comunidad académica a hacer avanzar la IA hacia mejores sistemas. Meta presentó un ejemplo de una cita incompleta que el modelo descubrió en el artículo de Wikipedia para Blackfoot Confederacy para demostrar las capacidades de Sphere. El artículo menciona a Joe Hipp, el primer nativo americano en competir por el título mundial de peso pesado de la AMB, en la sección de individuos notables de Blackfoot. Incluso si Hipp o el boxeo no se mencionaron en el sitio web vinculado, el modelo descubrió una cita más apropiada en una historia de 2015 del Great Falls Tribune al mirar a través de la base de datos de Sphere. Los poderes extraordinarios de Sphere se mostraron cuando se descubrió que el pasaje que encontró el modelo no hace referencia explícita al boxeo. La capacidad del modelo para comprender el lenguaje natural le permitió encontrar una referencia adecuada. Wikipedia aún no utiliza el modelo de IA para validar automáticamente las citas. Sin embargo, los investigadores de Meta quieren algún día integrarlo en la plataforma para que lo utilicen los editores de la enciclopedia. Estos modelos tienen un futuro brillante porque son los elementos iniciales de posibles editores que pueden ayudar en la verificación de documentos en tiempo real. La comparación también señaló que, además de sugerir citas, el sistema recomendaría autocompletar texto basado en documentos web pertinentes y proporcionaría sugerencias de edición. Actualmente, Sphere es de código abierto en Github, y los científicos de Meta están entusiasmados con estos desarrollos tecnológicos porque creen que serán la base para fabricar máquinas que puedan comprender nuestro mundo.
Este artículo está escrito como un artículo de resumen por el personal de Marktechpost basado en la investigación. papel1 y papel2. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la github.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools
Artículo anteriorColossal-AI, un sistema de aprendizaje profundo unificado para modelos grandes, acelera sin problemas los modelos grandes a bajo costo con la cara que abraza