Estás leyendo la publicación: Un estudio sobre varios modelos de pronóstico del tiempo basados en el aprendizaje profundo
Debido a su impacto en la vida humana en todo el mundo, el pronóstico del tiempo ha atraído el interés de varios investigadores de diversas comunidades de investigación. Muchos estudios han sido motivados para explorar patrones jerárquicos ocultos en el gran volumen de conjuntos de datos meteorológicos para el pronóstico del tiempo debido al reciente desarrollo de técnicas de aprendizaje profundo, la disponibilidad generalizada de datos masivos de observación meteorológica y el advenimiento de la tecnología informática y de la información. Las técnicas de aprendizaje automático se han aplicado para pronosticar fenómenos meteorológicos extremos, identificar patrones meteorológicos y climáticos extremos en condiciones atmosféricas observadas y modeladas, y proporcionar orientación operativa y evaluación de riesgos para condiciones meteorológicas adversas. Los últimos años han visto el desarrollo de modelos de pronóstico del tiempo basados en aprendizaje profundo como MetNet-2, WF-UNet, ClimaX, GraphCast, Pangu-Weather y más. Este artículo analiza brevemente estos modelos para obtener una idea de cómo estos modelos están superando rápidamente a los simuladores meteorológicos tradicionales por amplios márgenes.
ClimaX: modelo básico para el tiempo y el clima
Los modelos atmosféricos numéricos basados en la física son la columna vertebral del software de pronóstico del tiempo y el clima actual. Estas técnicas modelaron dinámicas no lineales e interacciones complejas de múltiples variables, lo que dificulta su aproximación. La simulación numérica de procesos atmosféricos con alta resolución espacial y temporal es computacionalmente exigente. Las técnicas actualizadas basadas en datos basadas en el aprendizaje automático manejan directamente las tareas de pronóstico o proyección posteriores mediante el entrenamiento de un mapeo funcional basado en datos en redes neuronales profundas. Estas redes carecen de generalidad de modelo numérico ya que están entrenadas en datos climáticos limitados y consistentes para tareas espaciotemporales discretas.
Una nueva investigación de Microsoft Autonomous Systems and Robotics Research, Microsoft Research AI4Science y UCLA presenta ClimaX, un modelo de aprendizaje profundo para la ciencia meteorológica y climática que se puede entrenar en diferentes conjuntos de datos con diferentes variables, cobertura espacial y temporal y bases físicas. ClimaX utiliza conjuntos de datos climáticos CMIP6 para entrenamiento no supervisado. Para aumentar la informática y mantener una amplia usabilidad, ClimaX amplía Transformer con nuevos bloques de codificación y agregación.
Después de la capacitación inicial, el climaX puede ajustarse para realizar una amplia gama de trabajos climáticos y meteorológicos, incluidos aquellos que involucran variables atmosféricas y diferentes escalas de tiempo y espacio. Incluso cuando se entrena previamente a resoluciones más bajas y con menos presupuestos computacionales, la universalidad de ClimaX le permite superar las líneas de base basadas en datos en los puntos de referencia de pronóstico del tiempo y predicción climática.
Los investigadores creen que la universalidad de este método puede hacerlo útil para propósitos más diversos. Esto puede incluir la predicción de eventos climáticos extremos y la evaluación del cambio climático antropogénico, dos ejemplos de tareas científicas de sistemas terrestres que podrían beneficiarse de una red troncal ClimaX que ya ha sido entrenada previamente. La agricultura, la demografía y las ciencias actuariales también son candidatos interesantes debido a sus estrechos vínculos con el tiempo y el clima.
Pangu-Weather para el pronóstico del tiempo global
Un equipo de investigadores de Huawei Cloud Computing presentó Pangu-Weather, un sistema global de pronóstico del tiempo basado en el aprendizaje profundo. El equipo reunió 43 años de datos meteorológicos globales por hora del reanálisis de quinta generación (ERA5) del ECMWF para crear un entorno basado en datos y entrenar algunas redes neuronales profundas con 256 millones de parámetros.
Este es el primer enfoque basado en IA que supera las técnicas de predicción meteorológica numérica (NWP) de vanguardia en términos de precisión de todas las variables (como geopotencial, humedad específica, velocidad del viento, temperatura, etc.) y en todas las escalas de tiempo (desde una hora a una semana). La precisión de la predicción aumenta utilizando una estrategia de agregación temporal jerárquica y una arquitectura de transformador específico de la Tierra 3D (3DEST) que transforma los datos de altura (nivel de presión) en datos cúbicos. El pronóstico determinista de corto a mediano plazo es Pangu-forte. Clima (es decir, el tiempo de pronóstico varía de una hora a una semana).
Varias opciones de predicción aguas abajo están disponibles en Pangu-Weather, como el seguimiento de ciclones tropicales y el pronóstico de conjuntos de miembros grandes en tiempo real. Pangu-Weather responde a la pregunta de si las técnicas basadas en IA pueden funcionar mejor que las técnicas de predicción numérica del tiempo y hace nuevas recomendaciones para mejorar los sistemas de predicción meteorológica de aprendizaje profundo.
El equipo cree que su método de entrenamiento aún no ha alcanzado la convergencia total. Hay margen para aumentar el número de componentes de observación, integrar la dimensión temporal en el entrenamiento de redes profundas 4D y utilizar redes más profundas y/o más amplias. Todos requieren GPU con más memoria y FLOP. Por lo tanto, los pronósticos meteorológicos futuros serán mejores debido a los recursos computacionales.
Un marco de aprendizaje profundo de resolución múltiple
Los eventos climáticos extremos amenazan sustancialmente la vida humana y la economía, con costos anuales de miles de millones de dólares y un número de víctimas de decenas de miles. Como resultado del cambio climático, se prevé que sus consecuencias e intensidad aumenten. Desafortunadamente, el principal instrumento para las proyecciones climáticas, los modelos de circulación general (GCM), no pueden definir adecuadamente los extremos climáticos.
Un grupo de científicos de Verisk Analytics, la Universidad Otto-von-Guericke y el Instituto de Tecnología de Massachusetts ha desarrollado un marco de aprendizaje profundo de resolución múltiple para acelerar la simulación de eventos climáticos extremos. Para eliminar los sesgos y mejorar la resolución de la simulación GCM, mezclan un GCM basado en la física realizado con una resolución gruesa con modelos de aprendizaje automático entrenados en datos de observación.
Los ingredientes principales son:
- Una estrategia de entrenamiento divide y vencerás que permite el entrenamiento de modelos regionales a una alta resolución espacial
- Nuevas funciones de pérdida estadística que enfatizan los valores extremos y la coherencia espacio-temporal
- Una representación compacta y multiescala de procesos físicos en la esfera que captura eficientemente las transferencias de energía a través de escalas.
Un tomador de decisiones puede utilizar la simulación desesgada a gran escala para observar los escenarios actuales y medir su exposición a desastres meteorológicos catastróficos, todo con un nivel de detalle arbitrario.
La arquitectura sugerida hace que las simulaciones de clima extremo de millones de años sean factibles, mejorando la cuantificación de eventos de desastre. A medida que aumenta la necesidad de simulaciones globales que tengan en cuenta las interdependencias entre muchas geografías y amenazas, los investigadores creen que esto ayudará a satisfacer ese requisito.
Corrección de polarización en tiempo real de pronósticos de campos de viento
Los pronósticos del Centro Europeo de Pronósticos Meteorológicos a Medio Plazo (ECMWF; EC para abreviar) pueden servir como base para desarrollar sistemas de alerta de desastres marítimos al tiempo que contienen algunos sesgos sistemáticos. Los datos del reanálisis atmosférico de quinta generación (ERA5) de la Comisión Europea son muy precisos; sin embargo, tiene unos días de retraso. El mapeo no lineal entre los datos de EC y ERA5 podría mejorarse con un enfoque de aprendizaje profundo espaciotemporal, lo que permite pronósticos de viento en tiempo real más precisos de EC.
Un estudio reciente de la Ocean University of China, el National Marine Environment Forecasting Center y la University of Portsmouth diseñó una función de pérdida de aprendizaje multitarea para corregir la velocidad y la dirección del viento utilizando un solo modelo. Lo implementaron en el modelo de unidad recurrente controlada de trayectoria de codificador doble multitarea (MT-DETrajGRU), que emplea una arquitectura mejorada de “pronosticador de codificador doble” para modelar los componentes de viento de secuencia espaciotemporal. El Pacífico Norte occidental (WNP) sirvió como región de investigación. Los pronósticos de campo de viento de 10 días de la CE se corrigieron por sesgo móvil en tiempo real desde diciembre de 2020 hasta noviembre de 2021 durante las cuatro estaciones. Después de ajustarse con el modelo MT-DETrajGRU, los sesgos de la velocidad y la dirección del viento en las cuatro estaciones se redujeron en un 8-11 % y un 9-14 %, respectivamente, en comparación con las previsiones originales de la CE.
Además, la técnica propuesta modeló los datos de manera consistente bajo diferentes circunstancias climáticas. El modo basado en datos construido aquí es resistente y generalizable, como lo demuestra el rendimiento de corrección similar en condiciones normales y de tifón. El equipo planea incorporar otras variables que influyen en el campo de viento, como la temperatura, la presión del aire y la humedad, en el modelo en futuras investigaciones.
Predicción de energía de parques eólicos y estelas aguas abajo utilizando patrones climáticos
Un nuevo estudio realizado por ECMWF, Bonn, Imperial College London, UK Meteorological Office, Exeter y Shell Research Ltd establece un flujo de trabajo de energía eólica novedoso que muestra por primera vez cómo se pueden integrar con éxito modelos numéricos de predicción meteorológica complicados con algoritmos de agrupamiento no supervisados para eficientemente hacer predicciones precisas a largo plazo de la potencia de los parques eólicos y las estelas aguas abajo. Este procedimiento comienza con la identificación de las tendencias meteorológicas mediante la agrupación no supervisada de k-medias en los datos de reanálisis de ERA5 para tener en cuenta la variabilidad regional y temporal. Para calcular la potencia de salida del clúster y la estela del parque eólico aguas abajo, se realiza una simulación WRF utilizando las condiciones meteorológicas promedio del centro del clúster.
Este análisis determina la mejor variable y tamaño de dominio para los patrones climáticos de producción de energía eólica marina. Después de ejecutar simulaciones WRF, el equipo aplicó un enfoque único de procesamiento posterior a las simulaciones de grupos para mejorar la producción de energía eólica a largo plazo y las predicciones de estelas aguas abajo. El método novedoso permite estimaciones de varios años y varias décadas de la potencia y las estelas aguas abajo de un parque eólico marino sin ejecutar una simulación. Si bien investigaciones anteriores han realizado exámenes a pequeña escala de estelas de parques eólicos río abajo, esta es la primera herramienta para disminuir estas estelas al proporcionar proyecciones precisas y rápidas a largo plazo que mejoran el conocimiento de la ubicación de los parques eólicos.
Al aplicar este enfoque a dos regiones de estudio de casos, el equipo demuestra que, si bien requiere menos del 2 % del esfuerzo informático, las predicciones a largo plazo propuestas logran una excelente concordancia con las de un año de simulaciones WRF. Al agrupar según la velocidad del viento, los resultados son los más precisos.
GraphCast: Pronóstico meteorológico global eficiente a medio plazo
Desde elegir un atuendo hasta qué hacer en caso de un huracán, las personas constantemente ajustan sus planes en función de las previsiones meteorológicas. Las personas confían en los pronósticos meteorológicos de “medio plazo”, que emiten los servicios meteorológicos hasta cuatro veces al día, para tomar decisiones que requieren conocer el clima diez días en el futuro.
Un estudio reciente de DeepMind y Google presenta GraphCast. Este nuevo simulador meteorológico basado en ML supera el sistema de pronóstico del tiempo de medio alcance operativo determinista más preciso del mundo y todas las líneas base de ML. El modelo autorregresivo de GraphCast se entrena con datos meteorológicos del archivo de reanálisis ERA5 en el Centro Europeo para la Previsión Meteorológica a Medio Plazo (ECMWF). El modelo se basa en redes de gráficos neuronales y una novedosa representación de malla multiescala de alta resolución. Tiene una resolución de alrededor de 25×25 kilómetros en el ecuador y puede crear pronósticos de 10 días a intervalos de 6 horas para cinco superficies y seis variables atmosféricas, cada una con 37 niveles de presión vertical.
En el 90,0 % de las 2760 combinaciones de variables y plazos de entrega, GraphCast superó al método de pronóstico operativo determinista del ECMWF, HRES. Para el 99,2 por ciento de los 252 objetivos que informó, GraphCast superó al modelo anterior de pronóstico del tiempo basado en ML más preciso. Con la tecnología Cloud TPU v4, GraphCast puede producir una predicción de 10 días (35 GB de datos) en menos de 60 segundos.
A diferencia de las técnicas de pronóstico más tradicionales, el pronóstico basado en ML puede crecer fácilmente en tamaño y sofisticación a medida que se dispone de datos adicionales para la capacitación. Este estudio es un avance importante para el modelado meteorológico basado en ML. En principio, se puede aplicar a un conjunto mucho más amplio de desafíos ambientales y de pronóstico geoespacial-temporal, como modelar varios factores meteorológicos y predicciones estacionales y climáticas, incendios forestales, deforestación, etc.
WeatherFusionNet para predecir precipitaciones a partir de datos satelitales
Los métodos de aprendizaje profundo han mejorado recientemente la precisión de la predicción meteorológica. Investigadores de la Universidad Técnica Checa en Praga presentaron dos modelos de aprendizaje profundo para pronosticar precipitaciones en el Desafío de la Cumbre Mundial AI for Good 2021 sobre la predicción de fenómenos meteorológicos extremos.
El primer modelo, sat2rad, es un modelo de aprendizaje profundo basado en U-Net que estima la precipitación en el paso de tiempo del marco satelital actual. Este modelo predice la lluvia para el área completa del satélite utilizando la invariancia espacial de las redes neuronales convolucionales, incluso si los datos de radar solo están disponibles para un área más pequeña. El modelo sat2rad se aplicó a los cuatro marcos de satélite por separado para generar cuatro canales.
El segundo modelo, PhyDNet, es una red convolucional recurrente que separa la dinámica física de la entrada visual complementaria. Dos ramas de PhyDNet manejan la dinámica física y la información residual para la predicción futura. Debido a los límites de la competencia, PhyDNet se entrenó con datos satelitales en lugar de marcos de radar. Para hacer la predicción, otra U-Net fusionó las salidas de ambos modelos con la secuencia de entrada.
El estudio indicó que el empleo de los modelos sat2rad y PhyDNet aumentó la predicción de precipitaciones. La invariancia espacial de las redes neuronales convolucionales ayudó a estimar la lluvia para el área completa del satélite, incluso si los datos de radar solo estaban disponibles para un área más pequeña.
WF-UNet: Weather Fusion UNet para predicción inmediata de precipitaciones
Los pronósticos precisos a corto plazo (inmediatos) de las precipitaciones son necesarios cuando se diseñan sistemas de alerta temprana para condiciones meteorológicas adversas y sus consecuencias, como inundaciones urbanas o deslizamientos de tierra. Hay varios usos ambientales para la predicción inmediata, desde la gestión agrícola hasta la mejora de la seguridad aérea.
La investigación colaborativa entre la Universidad de Maastricht y la Universidad de Utrecht explora la viabilidad de utilizar un modelo central de UNet y una extensión de ese modelo para predecir las precipitaciones en Europa occidental con hasta tres horas de anticipación. Su estudio propone el modelo Weather Fusion UNet (WF-UNet), que se basa en el modelo Core 3D-UNet al incluir variables como la velocidad del viento y la precipitación en el proceso de entrenamiento y luego analizar cómo estos factores afectan el desempeño de la tarea objetiva de predecir precipitación.
Usando el conjunto de datos ERA5 de Copernicus, el programa de observación de la Tierra de la Unión Europea, el equipo compiló imágenes de radar de precipitación y viento durante seis años (enero de 2016 a diciembre de 2021) en 14 países europeos, con una resolución temporal de 1 hora y una resolución espacial de 31 kilómetros cuadrados. . Evalúan el modelo WF-UNet propuesto en comparación con el modelo de persistencia y otras arquitecturas basadas en UNet entrenadas con datos de entrada de radar de precipitación única. Según los hallazgos, WF-UNet logra un MSE 22 %, 8 % y 6 % más bajo que los otros diseños de mejor desempeño analizados cuando el horizonte temporal es de 1, 2 y 3 horas, respectivamente. En comparación con el modelo UNet tradicional, la fusión a nivel de decisión es superior para capturar la información espaciotemporal incluida en las imágenes de radar archivadas. WF-UNet supera a otros modelos basados en UNet probados en el pronóstico inmediato a corto plazo gracias a sus capacidades superiores de extracción de características.