¿Cómo pueden el metaaprendizaje, la autoatención y JAX potenciar la próxima generación de optimizadores evolutivos?

Estás leyendo la publicación: ¿Cómo pueden el metaaprendizaje, la autoatención y JAX potenciar la próxima generación de optimizadores evolutivos?

Los métodos de optimización de caja negra se utilizan en todos los dominios, desde inteligencia artificial y aprendizaje automático hasta ingeniería y finanzas. Estos métodos se utilizan para optimizar funciones cuando no existe un modelo algebraico. La optimización de caja negra investiga el diseño y análisis de algoritmos para aquellas declaraciones de problemas donde la estructura de la función objetivo o las limitaciones que definen el conjunto no se conocen o no se pueden explicar. Dado un conjunto de parámetros de entrada, los métodos de optimización de caja negra están diseñados para evaluar el valor óptimo de una función. Esto se hace evaluando iterativamente la función en múltiples puntos en el espacio de entrada para encontrar el punto que genera la salida óptima.

Aunque el descenso de gradiente es el enfoque de optimización más utilizado para los modelos de aprendizaje profundo, no es adecuado para todos los problemas. En los casos en que los gradientes no se pueden calcular directamente o donde se desconoce la forma analítica precisa de una función objetivo, se utilizan otros enfoques como las Estrategias de evolución (ES). Las estrategias de evolución provienen de algoritmos evolutivos, que se refieren a una división de algoritmos de optimización basados ​​en la población inspirados en la selección natural. Básicamente, Evolution Strategies (ES) es un tipo de método de optimización de caja negra que opera refinando una distribución de muestreo basada en la aptitud de los candidatos y actualizando reglas basadas en ecuaciones.

🔥 Recomendado:  Cómo la tecnología está cambiando la forma en que jugamos a los juegos de cartas

En un nuevo artículo de IA, los investigadores de Deepmind presentaron y desarrollaron una nueva forma de usar el aprendizaje automático para aprender las reglas de actualización de los datos, llamada optimización de caja negra meta (MetaBBO), para hacer que ES sea más flexible, adaptable y escalable. . MetaBBO funciona mediante el metaaprendizaje de una parametrización de red neuronal de una regla de actualización de BBO. Los investigadores han utilizado MetaBBO para descubrir un nuevo tipo de ES llamado estrategia de evolución aprendida (LES). La estrategia de evolución aprendida LES es un tipo de Set Transformer que actualiza sus soluciones en función de la aptitud de los candidatos y no depende del orden de las soluciones candidatas dentro de las evaluaciones de Black box. Después del metaentrenamiento, el LES puede aprender a elegir la solución de mejor rendimiento o actualizar las soluciones en función de un promedio móvil.

La solución propuesta consiste básicamente en descubrir reglas efectivas de actualización de estrategias de evolución (ES) a través del metaaprendizaje. Algunas de las principales contribuciones son:

  1. Se ha introducido una parametrización de Estrategia de Evolución basada en la autoatención, que hace posible el metal-aprendizaje de algoritmos de optimización de caja negra.
  1. Este enfoque supera a los algoritmos ES artesanales existentes en tareas de neuroevolución, y este enfoque se generaliza en problemas de optimización, recursos informáticos y dimensiones del espacio de búsqueda.
  1. Los investigadores han descubierto que para metaevolucionar un buen ES, solo se requieren una serie de clases de optimización central en el momento del metaentrenamiento, incluidas funciones separables, multimodales y de alto condicionamiento.
  1. El enfoque consiste en eliminar los componentes de la caja negra para recuperar una estrategia interpretable. Indica que todos los componentes de la red neuronal influyen positivamente en el rendimiento inicial de la estrategia de búsqueda.
  1. Esta estrategia de evolución descubierta es una alternativa altamente competitiva a los métodos ES tradicionales y muy fácil de implementar.
  1. El estudio ha mostrado el proceso de creación de un LES novedoso desde cero que se inicializó aleatoriamente para iniciar su progreso de aprendizaje. Este proceso permite un metaaprendizaje autorreferencial de sus propios pesos.
🔥 Recomendado:  Cómo ver el historial de reproducciones en TikTok en 2023

En conclusión, con este estudio, el metaaprendizaje se puede utilizar para descubrir las reglas de actualización efectivas para las estrategias de evolución. De esta manera, el metaaprendizaje y la autoatención pueden ser prometedores para la próxima generación de Optimizadores Evolutivos.