Estás leyendo la publicación: Una mirada más cercana a los desarrolladores de renombre de Google detrás de GPT-4 y qué empresas emergentes ejecutan hoy
Si viste la serie “Silicon Valley” y no te perdiste el último episodio, entonces recuerda cómo terminó todo: el equipo se reúne veinte años después, rememorando el pasado.
Veamos qué pasó con los autores de la arquitectura de red neuronal Transformer que subyace en ChatGPT y GPT-4. El equipo apareció en el artículo “Atención es todo lo que necesitas” por Google Research (junio de 2017). Los autores se enumeran a continuación en el mismo orden que en el artículo de Google.
Ashish Vaswani dejó Google a fines de 2021 para comenzar Adepto, que ha recaudado $ 415 millones y está valorado en más de $ 1 mil millones hasta el momento. Sin embargo, Ashish dejó Adept hace unos meses, en diciembre de 2022, inmediatamente después del lanzamiento de ChatGPT, y fundó una nueva empresa. Por el momento, la puesta en marcha aún no tiene nombre, y no está claro cuántas personas se han unido a la empresa y en qué están trabajando.
De vuelta en Google, Vaswani trabajó en el diseño del modelo en las primeras etapas y lo programó todo.
Noam Shazeer trabajó en Google durante más de 20 años, desde diciembre de 2000. En octubre de 2021, renunció y fundó la startup Personaje.ai. Desde entonces, la empresa ya ha recaudado 200 millones de dólares y alcanzó una valoración de casi 1.000 millones de dólares. Según LinkedIn, hay alrededor de 20 empleados trabajando allí, por lo que el valor por dólar es impresionante. Fue Noam quien introdujo la idea de diferentes “cabezas” en el mecanismo de atención.
Niki Parmar, la única mujer coautora del artículo, fue investigadora del equipo de Google Brain hasta noviembre de 2021. Luego, se unió a Ashish Vaswani en Adept. Sin embargo, como ya sabemos, no se quedaron mucho tiempo allí y partieron juntos para iniciar un nuevo proyecto. Niki ha realizado muchos experimentos de entrenamiento y validación de modelos.
Jakob Uszkoreit — muchos lo llaman el cerebro principal detrás de la invención de la arquitectura Transformer. Fue él quien sugirió reemplazar las redes recurrentes con un mecanismo de “atención” similar y comenzó a crear prototipos del primer enfoque. Dejó Google a mediados de 2021 y fundó Vida Inceptiva, donde el equipo está trabajando en el modelado de redes neuronales de ARNm. El ARNm es lo que (a veces) sustenta las vacunas (por ejemplo, la vacuna Covid-19 de Pfizer-BioNTech).
león jones es la única persona en esta lista que trabaja en Google hasta el día de hoy. Según él, fue él quien sugirió el título del artículo, que se convirtió en un meme y dio lugar a decenas de otros artículos con el patrón “X es todo lo que necesitas”. También fue responsable de optimizar la inferencia y visualización de modelos para experimentos y artículos.
Aidán Gómez dejó Google en el otoño de 2019 para fundar Cohere.ai. La empresa sigue trabajando en modelos lingüísticos; algunos de sus productos son similares a los casos de uso que tenían las personas en los primeros días después del lanzamiento de ChatGPT. Logré atraer más de $400 millones en inversiones y hacer crecer la empresa a casi 200 empleados.
lukasz káiser, tras más de siete años en Google, se fue en el verano de 2021 para trabajar en OpenAI. El artículo original establece que Lukasz fue el responsable del desarrollo y optimización del código. Es uno de los coautores de TensorFlow, una biblioteca para crear y entrenar redes neuronales. Es un ingeniero muy fuerte y ahora está trabajando en GPT 👀 Como parte del trabajo en Transformer, trabajó con Aidan Gomez para mejorar la base de código y acelerar las iteraciones en el trabajo de investigación (a través de una interacción y creación de prototipos más fáciles).
Illia Polosukhin dejó Google en 2017, antes de la publicación del artículo, para fundar Cerca, un protocolo de cadena de bloques que es esencialmente un competidor de Ethereum. Su valoración actual es de unos 2.000 millones de dólares y en tan solo seis años se han recaudado más de 375 millones de dólares como inversiones.
Lea más sobre la IA: