Deepmind presenta ‘AlphaTensor’, un sistema de inteligencia artificial (IA) para descubrir algoritmos novedosos, eficientes y exactos para la multiplicación de matrices

Estás leyendo la publicación: Deepmind presenta ‘AlphaTensor’, un sistema de inteligencia artificial (IA) para descubrir algoritmos novedosos, eficientes y exactos para la multiplicación de matrices

Mejorar la eficiencia de los algoritmos para los cálculos fundamentales es una tarea crucial hoy en día, ya que influye en el ritmo general de una gran cantidad de cálculos que pueden tener un impacto significativo. Una de esas tareas simples es la multiplicación de matrices, que se puede encontrar en sistemas como redes neuronales y rutinas de computación científica. El aprendizaje automático tiene el potencial de ir más allá de la intuición humana y vencer a los algoritmos diseñados por humanos más ejemplares disponibles actualmente. Sin embargo, debido a la gran cantidad de algoritmos posibles, este proceso de descubrimiento automatizado de algoritmos es complicado. DeepMind hizo recientemente un descubrimiento revolucionario al desarrollar AplhaTensor, el primer sistema de inteligencia artificial (IA) para desarrollar algoritmos nuevos, efectivos e indudablemente correctos para operaciones esenciales como la multiplicación de matrices. Su enfoque responde a un rompecabezas matemático que ha estado abierto durante más de 50 años: cómo multiplicar dos matrices lo más rápido posible.

AlphaZero, un agente que mostró un rendimiento sobrehumano en juegos de mesa como el ajedrez, el go y el shogi, es la base sobre la que se construye AlphaTensor. El sistema amplía la progresión de AlphaZero desde jugar juegos tradicionales hasta resolver problemas matemáticos complejos por primera vez. El equipo cree que este estudio representa un hito importante en el objetivo de DeepMind de mejorar la ciencia y utilizar la IA para resolver los problemas más fundamentales. La investigación también ha sido publicada en la reconocida revista Nature.

La multiplicación de matrices tiene numerosas aplicaciones en el mundo real a pesar de ser uno de los algoritmos más simples que se les enseña a los estudiantes de secundaria. Este método se utiliza para muchas cosas, incluido el procesamiento de imágenes en teléfonos inteligentes, la identificación de comandos verbales, la creación de gráficos para videojuegos y mucho más. El desarrollo de hardware informático que multiplica matrices efectivamente consume muchos recursos; por lo tanto, incluso pequeñas ganancias en la eficiencia de la multiplicación de matrices pueden tener un impacto significativo. El estudio investiga cómo se podría avanzar en el desarrollo automático de nuevos algoritmos de multiplicación de matrices mediante el uso de enfoques contemporáneos de IA. Para encontrar algoritmos que sean más efectivos que los de última generación para muchos tamaños de matriz, AlphaTensor se apoya aún más en la intuición humana. Sus algoritmos diseñados por IA superan a los creados por humanos, lo que representa un avance significativo en el descubrimiento algorítmico.

🔥 Recomendado:  La última investigación de aprendizaje automático de CMU presenta 'DASH', un algoritmo NAS diferenciable que calcula la combinación de operaciones utilizando la diagonalización de convolución de Fourier,...

El primer paso para desarrollar el algoritmo fue crear un juego para un solo jugador a partir del problema de encontrar métodos efectivos de multiplicación de matrices. El tablero del juego es un tensor tridimensional para medir cuán inexacto es el algoritmo actual. El jugador intenta alterar el tensor y poner a cero sus entradas mediante el uso de un conjunto de movimientos permitidos que coinciden con las instrucciones del algoritmo. Cuando el jugador logra hacerlo, esto produce un algoritmo de multiplicación de matrices que puede demostrar ser preciso para cualquier par de matrices. Su eficacia se mide por el número de pasos necesarios para poner a cero el tensor.

Sin embargo, este juego es muy desafiante en comparación con otros juegos de mesa convencionales. Incluso para ejemplos simples de multiplicación de matrices, hay más algoritmos alternativos a considerar en este juego que los átomos en el universo. El equipo de DeepMind primero creó varios elementos esenciales, incluida una arquitectura de red neuronal novedosa que incorpora sesgos inductivos específicos del problema, un método para producir datos sintéticos valiosos y una receta para aprovechar las simetrías del problema para abordar los desafíos del juego. Después de eso, se le enseñó a un agente de AlphaTensor a jugar el juego utilizando el aprendizaje por refuerzo, comenzando sin conocimiento previo de las técnicas de multiplicación de matrices existentes. El agente aprende a medida que avanza, superando finalmente la intuición humana y aprendiendo más rápido que los algoritmos conocidos anteriormente, incluidos los algoritmos históricos de multiplicación de matrices rápidas como el de Strassen.

Además, el algoritmo de AlphaTensor es el primero en superar el enfoque de dos niveles de Strassen en un campo finito desde que se descubrió hace cincuenta años. Estas técnicas simples de multiplicación de matrices se pueden usar como primitivas para multiplicar matrices significativamente más grandes de cualquier dimensión. AlphaTensor también descubre una amplia gama de algoritmos de complejidad de última generación, hasta miles para cada tamaño de multiplicación de matrices, lo que demuestra que el espacio de los algoritmos de multiplicación de matrices es más rico de lo que se creía anteriormente. Estos métodos demuestran la adaptabilidad de AlphaTensor en la optimización de objetivos arbitrarios mediante la multiplicación de matrices grandes entre un 10 y un 20 % más rápido que los algoritmos convencionales en el mismo hardware.

🔥 Recomendado:  Descripción del puesto de redactor publicitario: plantillas para contratar en su negocio

Con el fin de identificar los algoritmos más eficientes para manejar los desafíos informáticos, los investigadores esperan que sus hallazgos sirvan como trampolín para futuras investigaciones sobre la teoría de la complejidad. Debido a que la multiplicación de matrices es una operación fundamental en muchos cálculos, las técnicas desarrolladas por AlphaTensor pueden mejorar significativamente la eficiencia de los cálculos en varias áreas. La adaptabilidad del sistema para considerar cualquier forma de propósito puede inspirar nuevas aplicaciones para desarrollar algoritmos que optimicen métricas como el consumo de energía y la estabilidad numérica. Aunque la investigación se concentró en el problema específico de la multiplicación de matrices, DeepMind espera alentar a otros a aplicar IA para dirigir el desarrollo de algoritmos para otros trabajos computacionales esenciales. Su investigación también demuestra cómo AlphaZero es un potente algoritmo que se puede aplicar mucho más allá del ámbito de los juegos convencionales para ayudar en la solución de problemas matemáticos abiertos. El grupo aspira a utilizar la IA en el futuro para ayudar a la sociedad a resolver algunos de los problemas más importantes de las ciencias y las matemáticas.

Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el documento de investigación preliminar ‘DDescubriendo algoritmos de multiplicación de matrices más rápidos con aprendizaje por refuerzo‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel y artículo de mente profunda.

Por favor no olvides unirte Nuestro subreddit de ML

Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools