Estás leyendo la publicación: IBM Research presenta la Unidad de inteligencia artificial (AIU): es el primer sistema en chip completo diseñado para ejecutar y entrenar modelos de aprendizaje profundo de manera más rápida y eficiente que…
El trabajo de los investigadores académicos hace más de diez años fue crucial en el desarrollo de la inteligencia artificial contemporánea tal como la vemos hoy. Se demostró que entrenar un modelo de aprendizaje profundo para reconocer objetos y animales en imágenes nuevas requirió días de computación de fuerza bruta sobre millones de imágenes. El aprendizaje profundo ahora realiza miles de otras actividades cruciales y significativas, como encontrar tumores malignos en rayos X, traducir idiomas, etc., además de cómo se usaba anteriormente para clasificar imágenes de gatos y perros.
Sin embargo, los avances de la IA moderna vienen con su propio conjunto de dificultades, y el poder computacional es un problema destacado. Aunque la cantidad de modelos de IA está aumentando exponencialmente, el hardware necesario para entrenar estos modelos y ejecutarlos en servidores en la nube o dispositivos periféricos como teléfonos inteligentes y sensores no ha mejorado a la misma escala. El IBM Research AI Hardware Center llevó a cabo una investigación innovadora para desarrollar un chip informático dedicado a la IA, al que se refieren como la Unidad de Inteligencia Artificial, o AIU, para abordar este problema. Es su primer sistema en chip con todas las funciones creado para entrenar y operar modelos de aprendizaje profundo de manera más rápida y efectiva que una CPU de propósito general.
Incluso antes de que el aprendizaje profundo sufriera las transformaciones revolucionarias que llevaron al estado actual de la informática, las unidades centrales de procesamiento, o CPU, como las conocemos, han sido el pilar de la informática tradicional. Las aplicaciones para software de propósito general son ideales para la flexibilidad y alta precisión de las CPU. Sin embargo, esos rasgos ventajosos los ponen en desventaja con respecto al entrenamiento y la operación del modelo de aprendizaje profundo, que exigen procesos de IA masivamente paralelos.
Los modelos de aprendizaje profundo se han utilizado para renderizar gráficos de videojuegos durante los últimos diez años en CPU y GPU. Sin embargo, un procesador multipropósito es esencial para las optimizaciones requeridas para las muchas operaciones de multiplicación de matrices y vectores que se usan en el aprendizaje profundo. Los investigadores idearon dos rutas clave para llegar allí durante el proceso de diseño de más de cinco años para la AIU de IBM. La primera ruta implicó aceptar una menor precisión. El equipo razonó que un chip de IA podría ser menos preciso que una CPU porque se usa principalmente para hacer predicciones y decisiones, lo que no requiere el mismo nivel de precisión necesario para calcular la trayectoria de aterrizaje de la nave espacial.
Es posible reducir la aritmética de punto flotante de 32 bits a formatos de bits que transportan una cuarta parte de la cantidad de datos. Esto se logró a través de la computación de aproximación, un método innovador desarrollado por IBM. Este enfoque simplificado reduce significativamente el cálculo necesario para entrenar y mantener un modelo de IA sin comprometer la precisión.
El diseño del chip de IA era la segunda preocupación principal, que debía hacerse para optimizar las operaciones de IA. La arquitectura del chip tiene un diseño más sencillo que una CPU multipropósito porque la matriz y la multiplicación de vectores son los componentes principales de la mayoría de las operaciones de IA. Además, IBM AIU está diseñado para transmitir datos directamente de un motor informático al siguiente, lo que genera un ahorro de energía significativo. IBM AIU es un “circuito integrado de aplicación específica” (ASIC). Está diseñado para el aprendizaje profundo y se puede entrenar para realizar cualquier actividad de aprendizaje profundo, incluido el procesamiento de lenguaje hablado, texto e imágenes en una pantalla. IBM AIU es tan fácil de usar como una tarjeta gráfica.
IBM destaca el hecho de que este chip no se creó totalmente desde cero. En cambio, es una versión reducida de un acelerador de IA ya exitoso incluido en el procesador Telum de IBM. Los 32 núcleos en IBM AIU reflejan fielmente el núcleo de IA en el chip Telum del sistema z16 más nuevo de Telum. La hoja de ruta agresiva del Centro de hardware de IA para aumentar la potencia informática de IA de IBM produjo la tecnología de IA que se incorpora en Telum y AIU.
Para superar las limitaciones provocadas por el tiempo y los costos necesarios para desarrollar y mantener modelos de aprendizaje profundo, IBM estableció el Centro de hardware de IA en 2019. Esta iniciativa tiene como objetivo cerrar la brecha entre lo que la IA puede lograr y su estado actual. La IA tiene el potencial de resolver problemas cruciales del mundo real que enfrentan las personas. Se requiere hardware de escala industrial y de grado empresarial para resolver la complejidad del mundo real, como pronosticar el próximo huracán Ian o determinar si una recesión está a punto de comenzar, y AIU de IBM nos acerca un paso más. IBM tiene la visión de ejecutar modelos de IA 1000 veces más rápido que hace solo tres años para 2029. El equipo anticipa anunciar pronto los detalles de su lanzamiento.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools