Estás leyendo la publicación: Salesforce AI Research propone ‘DeepTime’, un modelo basado en un índice de tiempo profundo entrenado a través de una formulación de metaaprendizaje para aprender automáticamente una función de representación a partir de datos de series temporales
En muchas aplicaciones comerciales y científicas, el desafío de pronosticar o predecir valores futuros con base en valores históricos es crucial. Esto se debe a que la previsión puede ayudar a tomar decisiones críticas, como cuánto inventario de un producto determinado se debe tener disponible o cómo asignar recursos de manera efectiva en un centro de datos. Los datos de series de tiempo, una colección secuencial de datos numéricos que normalmente se recopilan en intervalos de tiempo regulares, se utilizan para realizar pronósticos. Algunos ejemplos incluyen las ventas totales diarias de un producto en particular de una plataforma de comercio electrónico o la utilización minuto a minuto de la CPU de un servidor en un centro de datos. Los dos tipos de datos de series temporales son estacionarios y no estacionarios. La estacionariedad describe tanto la regularidad de los patrones estadísticos de la serie temporal como los valores de los datos que permanecen dentro de un rango determinado. A diferencia de la no estacionariedad, que es un fenómeno en el que la distribución estadística de los datos de series temporales no permanece estacionaria, las series temporales estacionarias conservan la información estadística de los datos de series temporales (como la media o la varianza).
Los humanos a menudo adquieren nuevos conceptos de manera más rápida y efectiva que los modelos de aprendizaje automático, que con frecuencia necesitan enormes cantidades de datos de entrenamiento para funcionar correctamente. Las técnicas de metaaprendizaje a menudo buscan replicar el tipo de aprendizaje rápido que ven los humanos mediante la utilización de un ciclo de aprendizaje interno y externo. El ciclo de aprendizaje interno recoge rápidamente nueva información de un conjunto condensado de muestras conocido como conjunto de soporte. La capacidad del bucle interior para realizar esta rápida adaptación a nuevos conjuntos de soporte está garantizada por el bucle de aprendizaje exterior. Ser entrenado en un conjunto de consultas, un conjunto de instancias del conjunto de soporte inicial que es comparable pero distinto, logra esto.
A medida que ha crecido la infraestructura de TI, también lo ha hecho la capacidad para recopilar grandes cantidades de estos datos, lo que da como resultado conjuntos de datos de series temporales extraordinariamente largos. Dado que los datos se recopilan en volúmenes significativos a lo largo del tiempo, es probable que también cambie el mecanismo que produce los datos. Por ejemplo, las ventas diarias pueden aumentar drásticamente si un producto se vuelve popular en comparación con años anteriores. Como resultado, los patrones de los datos recopilados cambian con el tiempo, creando una serie temporal no estacionaria.
Aunque tener acceso a más datos suele ser ventajoso en el aprendizaje automático (ML), presenta un desafío cuando se aplican algoritmos de aprendizaje automático a dichos datos porque la mayoría de las técnicas funcionan mejor con datos distribuidos uniformemente. El cambio de covariable y el cambio de distribución condicional son dos problemas con los datos que hacen que los modelos se degraden cuando el sistema cambia. Un cambio de covariable ocurre cuando cambian las estadísticas de los valores de la serie temporal, mientras que un cambio de distribución condicional ocurre cuando cambia el método utilizado para producir los datos.
Por lo tanto, el desempeño de los métodos de pronóstico de series de tiempo existentes puede degradarse debido a la no estacionariedad. Para superar estos inconvenientes, los investigadores de Salesforce han desarrollado un nuevo enfoque para el pronóstico de series de tiempo no estacionario denominado DeepTime. Este método aborda los problemas inherentes a las secuencias de datos de series de tiempo extensas al extender los modelos de índice de tiempo tradicionales al paradigma de aprendizaje profundo. DeepTime utiliza una novedosa formulación de tareas de pronóstico de metaaprendizaje para sortear el problema de las redes neuronales demasiado expresivas. Esto convirtió a Salesforce en la primera empresa del sector en presentar cómo utilizar modelos de índices temporales profundos para la previsión de series temporales.
La metodología utiliza modelos de índice de tiempo profundo, en los que la función preespecificada se sustituye por una red neuronal profunda, a diferencia de los métodos de índice de tiempo tradicionales, que especifican manualmente el vínculo entre las características del índice de tiempo y los valores de salida. En lugar de especificar manualmente estas asociaciones, el modelo puede aprenderlas de los datos. Las redes neuronales profundas son demasiado expresivas y, con frecuencia, hacen que los datos se sobreajusten, por lo que hacerlo ingenuamente da como resultado pronósticos deficientes. Para resolver este problema, los investigadores utilizaron una formulación de metaaprendizaje.
Deeptime de Salesforce aborda la no estacionariedad con la ayuda de la suposición de distribución estacionaria local. Como resultado, aun cuando la secuencia larga no es estacionaria, es razonable creer que los pasos de tiempo cercanos aún exhiben los mismos patrones y distribución que pueden alterarse gradualmente con el tiempo. Como resultado, una serie de tiempo extensa se puede dividir en tareas que se supone que son estacionarias. La serie temporal se divide en una ventana retrospectiva (datos históricos) y un horizonte de previsión para cada tarea (los valores a predecir). El horizonte de predicción es el conjunto de consultas en el sistema de metaaprendizaje, y la ventana retrospectiva es el conjunto de soporte.
Las redes neuronales profundas tienen muchos parámetros que aprender; por lo tanto, el metaaprendizaje de todo el modelo puede ser laborioso y llevar mucho tiempo. Para abordar esto, los investigadores modificaron la arquitectura del modelo para acortar el período de capacitación. El concepto crítico es solo usar el paso de adaptación del bucle interno de metaaprendizaje en el regresor de la cresta, que es la capa final y se puede calcular rápidamente durante el entrenamiento. DeepTime puede evitar el cambio de distribución condicional y los problemas de cambio de covariable debido a esta formulación.
El equipo probó su enfoque utilizando datos sintéticos y reales. DeepTime puede extrapolar funciones ocultas que contienen patrones novedosos a los que no se le dio acceso en los datos de entrenamiento mientras trabajaba con datos sintéticos. El marco logra un rendimiento de vanguardia en 20 de 24 configuraciones (basadas en la métrica de error cuadrático medio) en seis conjuntos de datos de series temporales del mundo real de una variedad de dominios de aplicación y horizontes de pronóstico. La arquitectura sobresaliente también demuestra una eficiencia excepcional, superando todos los puntos de referencia en términos de costos de memoria y tiempo de ejecución.
El uso de la regresión de cresta por parte de DeepTime hace posible que el marco logre una solución precisa de un solo paso en lugar de una iterativa aproximada al garantizar que los valores predichos estén más cerca de los reales. Como resultado, DeepTime ofrece un método superior para desarrollar respuestas en el campo de la previsión de series temporales. Una de las principales ventajas de DeepTime es que es una técnica de pronóstico de series de tiempo que es más rápida, más precisa y, en última instancia, más beneficiosa que otras técnicas. También puede ofrecer proyecciones más precisas con respecto a los efectos en la economía y los negocios, lo que puede ayudar con las decisiones más adelante, incluida la asignación de recursos (cuando se usa para el pronóstico de ventas) o la planificación del centro de datos. Además, el uso del modelo de pronóstico en las empresas podría potencialmente tener una menor huella de carbono debido a la mejor eficiencia de los marcos.
Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘DEEPTIME: META-APRENDIZAJE DEL ÍNDICE DE TIEMPO PROFUNDO PARA PRONÓSTICOS DE SERIES DE TIEMPO NO ESTACIONARIOS‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel, enlace github y artículo de referencia.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools