Estás leyendo la publicación: Conozca FathomNet: una base de datos de imágenes de código abierto que utiliza inteligencia artificial y algoritmos de aprendizaje automático para ayudar a procesar la acumulación de datos visuales para comprender…
El océano está cambiando a un ritmo sin precedentes, lo que dificulta mantener una administración responsable mientras se monitorean visualmente grandes cantidades de datos marinos. La cantidad y el ritmo de la recopilación de datos necesarios están superando nuestra capacidad para procesarlos y analizarlos rápidamente a medida que la comunidad investigadora busca líneas de base. La falta de coherencia de los datos, el formato inadecuado y el deseo de conjuntos de datos significativos y etiquetados han contribuido al éxito limitado de los avances recientes en el aprendizaje automático, que han permitido un análisis visual de datos rápido y más complejo.
Para cumplir con este requisito, varias instituciones de investigación trabajaron con MBARI para acelerar la investigación oceánica utilizando las capacidades de la inteligencia artificial y el aprendizaje automático. Uno de los resultados de esta asociación es FathomNet, una base de datos de imágenes de código abierto que emplea algoritmos de procesamiento de datos de vanguardia para estandarizar y agregar datos etiquetados cuidadosamente seleccionados. El equipo cree que el uso de la inteligencia artificial y el aprendizaje automático será la única forma de acelerar los estudios críticos sobre la salud de los océanos y eliminar el cuello de botella para el procesamiento de imágenes submarinas. Los detalles sobre el proceso de desarrollo detrás de esta nueva base de datos de imágenes se pueden encontrar en una publicación de investigación reciente en la revista Scientific Reports.
El aprendizaje automático ha transformado históricamente el campo del análisis visual automatizado, en parte gracias a los grandes volúmenes de datos anotados. Cuando se trata de aplicaciones terrestres, los conjuntos de datos de referencia a los que acuden los investigadores de aprendizaje automático y visión artificial son ImageNet y Microsoft COCO. Para brindar a los investigadores un estándar rico y atractivo para el análisis visual submarino, el equipo creó FathomNet. Con el fin de establecer un recurso de entrenamiento de imágenes submarinas altamente mantenido y de libre acceso, FathomNet combina imágenes y grabaciones de muchas fuentes diferentes.
Los investigadores del Laboratorio de video de MBARI anotaron cuidadosamente los datos que representan casi 28 000 horas de video de aguas profundas y más de 1 millón de fotografías de aguas profundas que MBARI recopiló durante 35 años. Alrededor de 8,2 millones de anotaciones que documentan observaciones de animales, ecosistemas y objetos están presentes en la videoteca de MBARI. Este completo conjunto de datos sirve como una herramienta invaluable para los investigadores del instituto y sus colaboraciones internacionales. El Laboratorio de tecnología de exploración de la National Geographic Society recopiló más de 1000 horas de datos de video de varios hábitats marinos y lugares en todas las cuencas oceánicas. Estas grabaciones también se han utilizado en la plataforma de análisis colaborativo basada en la nube desarrollada por CVision AI y anotada por expertos de la Universidad de Hawái y OceansTurn.
Además, en 2010, el equipo de exploración oceánica de la Administración Nacional Oceánica y Atmosférica (NOAA) a bordo del barco Okeanos Explorer de la NOAA recopiló datos de video utilizando un sistema dual de vehículos operados a distancia. Para poder anotar los videos recopilados de manera más extensa, comenzaron a financiar a taxónomos profesionales en 2015. Inicialmente, obtuvieron anotaciones de forma colectiva a través de científicos participantes voluntarios. Una parte del conjunto de datos de MBARI, así como materiales de National Geographic y NOAA, están incluidos en FathomNet.
Dado que FathomNet es de código abierto, otras instituciones pueden contribuir fácilmente y utilizarlo en lugar de los métodos convencionales que consumen más tiempo y recursos para procesar y analizar datos visuales. Además, MBARI inició una iniciativa piloto para usar modelos de aprendizaje automático entrenados con datos de FathomNet para analizar videos tomados por vehículos submarinos controlados de forma remota (ROV). El uso de algoritmos de IA aumentó diez veces la tasa de etiquetado y redujo el esfuerzo humano en un 81 por ciento. Los algoritmos de aprendizaje automático basados en datos de FathomNet pueden revolucionar la exploración y el monitoreo de los océanos. Uno de esos ejemplos incluye el uso de vehículos robóticos equipados con cámaras y algoritmos de aprendizaje automático mejorados para la búsqueda y el seguimiento automáticos de la vida marina y otras cosas submarinas.
Con contribuciones continuas, FathomNet tiene actualmente 84 454 imágenes que reflejan 175 875 localizaciones de 81 colecciones diferentes para 2243 conceptos. El conjunto de datos pronto tendrá más de 200 millones de observaciones después de obtener 1000 observaciones independientes para más de 200 000 especies animales en varias posiciones y configuraciones de imágenes. Hace cuatro años, la falta de fotos anotadas impidió que el aprendizaje automático examinara miles de horas de películas oceánicas. Sin embargo, al desbloquear descubrimientos y habilitar herramientas que los exploradores, científicos y el público en general pueden utilizar para acelerar el ritmo de la investigación oceánica, FathomNet convierte esta visión en una realidad.
FathomNet es una ilustración fantástica de cómo la colaboración y la ciencia comunitaria pueden promover innovaciones en nuestra comprensión del océano. El equipo cree que el conjunto de datos puede ayudar a acelerar la investigación oceánica cuando comprender el océano es más crucial que nunca, utilizando datos de MBARI y otros colaboradores como base. Los investigadores también enfatizan su deseo de que FathomNet funcione como una comunidad donde los aficionados al océano y los exploradores de todos los ámbitos de la vida puedan compartir sus conocimientos y habilidades. Esto actuará como un trampolín para abordar los problemas con los datos visuales del océano que, de otro modo, no habrían sido posibles sin una amplia participación. Para acelerar el procesamiento de datos visuales y crear un océano sostenible y saludable, FathomNet se mejora constantemente para incluir más datos etiquetados de la comunidad.
Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘FathomNet: una base de datos de imágenes global para habilitar la inteligencia artificial en el océano‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel, herramienta y artículo de referencia.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools