Estás leyendo la publicación: Por qué resolver la eficiencia de la multiplicación de matrices es tan importante en informática
Debes haberte encontrado con la multiplicación de matrices en los libros de texto escolares. Pero, ¿sabía cuán relevante es en todos los aspectos de nuestra vida diaria, desde el procesamiento de imágenes en nuestros teléfonos y el reconocimiento de comandos de voz hasta la generación de gráficos para juegos de computadora?
Es el núcleo de casi todo lo computacional.
Con el último lanzamiento de DeepMind, AlphaTensor, un sistema de inteligencia artificial, los investigadores arrojaron luz sobre una pregunta matemática fundamental de hace 50 años: encontrar la forma más rápida de multiplicar dos matrices.
“AlphaTensor descubrió algoritmos que son más eficientes que los de última generación para muchos tamaños de matriz. Nuestros algoritmos diseñados por IA superan a los diseñados por humanos, lo que es un gran paso adelante en el campo del descubrimiento algorítmico”, dijo DeepMind en un comunicado.
El avance es una extensión de AlphaZero, un sistema único que domina los juegos de mesa (ajedrez, go y shogi) desde cero sin intervención humana. Además, la investigación revela que AlphaZero es un algoritmo poderoso que puede extenderse más allá del dominio de los juegos tradicionales para ayudar a resolver problemas matemáticos abiertos.
El problema en cuestión
La multiplicación de matrices es una de las formas matemáticas más simples, pero se vuelve intensamente compleja cuando se aplica en el mundo digital. Cualquier cosa que se pueda resolver numéricamente, desde predecir el clima hasta comprimir datos, generalmente usa matrices. Por ejemplo, puede leer este artículo en su pantalla porque sus píxeles se representan como una cuadrícula y se actualizan con nueva información más rápido de lo que sus ojos pueden rastrear.
A pesar de su naturaleza omnipresente, el cálculo no se entiende muy bien. Además, nadie conoce un método más rápido para resolver el problema porque hay infinitas formas de hacerlo.
El plan de juego de DeepMind
Los avances en el aprendizaje automático han ayudado a los investigadores desde la creación de arte hasta la predicción de estructuras de proteínas. Cada vez más, los investigadores están utilizando algoritmos para convertirse en su propio maestro y corregir las fallas.
Los investigadores de DeepMind hicieron lo que mejor saben hacer: convertir a la IA en campeona en los juegos.
El equipo abordó el problema de la multiplicación de matrices convirtiéndolo en un juego de mesa en 3D para un solo jugador llamado ‘TensorGame’. El juego es inmensamente desafiante ya que la cantidad de algoritmos posibles, incluso para casos pequeños de multiplicación de matrices, es mayor que la cantidad de átomos en el universo.
El tablero tridimensional representa el problema de multiplicación y cada movimiento representa el siguiente paso para resolverlo. La serie de movimientos realizados en el juego, por lo tanto, representa un algoritmo.
Para jugar el juego, los investigadores entrenaron una nueva versión de AlphaZero, llamada ‘AlphaTensor’. En lugar de aprender los mejores movimientos para hacer en Go o ajedrez, el sistema aprendió los mejores pasos para hacer al multiplicar matrices. Luego, usando el aprendizaje por refuerzo favorito de DeepMind, el sistema fue recompensado por ganar el juego en la menor cantidad de movimientos posible.
El sistema de IA descubrió una forma de multiplicar dos matrices de 4 × 4 usando solo 47 multiplicaciones, en lugar de las 64 que se necesitan si tuviera que multiplicar minuciosamente cada fila con cada columna de su matriz correspondiente. Eso también es dos pasos menos que los 49 encontrados por Volker Strassen en 1969, cuyo método de multiplicación para matrices de 4×4 había mantenido el récord del más rápido durante más de 50 años.
¿Qué hay por delante?
El hallazgo podría aumentar algunas velocidades de cómputo hasta en un 20% en hardware como una unidad de procesamiento de gráficos (GPU) Nvidia V100 y una unidad de procesamiento de tensor (TPU) v2 de Google, pero no hay garantía de que esas ganancias también se vean en un teléfono inteligente o computadora portátil.
DeepMind ahora planea usar AlphaTensor para buscar otros tipos de algoritmos. “Si bien es posible que podamos ampliar los límites un poco más con este enfoque computacional”, dijo Gray Ballard, científico informático de la Universidad Wake Forest en Winston-Salem, Carolina del Norte, “Estoy emocionado de que los investigadores teóricos comiencen a analizar los nuevos algoritmos que han encontrado para encontrar pistas sobre dónde buscar el próximo avance”.