Mark Zuckerberg acaba de presentar los nuevos modelos de IA de Meta y le están dando a la gente muchas razones para entusiasmarse.
Llama 3, presentado el jueves pasado, es el último intento del metajefe de enfrentarse a sus rivales en la carrera por desarrollar formas más poderosas de IA. La compañía llama a esta nueva generación los modelos “más potentes” disponibles hasta la fecha.
Aunque los modelos Llama 3 tienen el mismo tamaño que sus predecesores, “establecen un nuevo estándar a esta escala”, afirma Meta. Esto se debe a la mejora de habilidades en áreas como el razonamiento y la generación de código.
También se han realizado más ajustes para abordar las quejas de que los modelos de IA de última generación eran «un poco puritanos», como dijo Nick Clegg de Meta en una entrevista con Tiempos financieros.
Quizás el detalle más importante es que los modelos de código abierto de Meta pronto estarán a la par con sus homólogos de código cerrado. Los modelos Llama-3 más grandes con 400 mil millones de parámetros y características multimodales, que según Meta todavía están en la fase de desarrollo, serán comparables a modelos propietarios como Claude 3 Opus de Anthropic y GPT-4 de OpenAI en el momento de su lanzamiento.
Será un gran avance para los desarrolladores de IA de código abierto. El año pasado, los modelos de IA en los que estaban trabajando parecían bastante rudimentarios y tenían dificultades para completar oraciones sin repetirlas.
Como señaló el mes pasado la fundadora de AI, Sharon Zhou, no era inusual ver una respuesta a una pregunta como «'Mi nombre es'».
Entonces sí, Llama 3 es un gran paso adelante para Zuck y para las ambiciones de IA de la comunidad de código abierto en su conjunto. Pero también demuestra que el modelo de Sam Altman de hace un año sigue siendo la referencia.
Últimas noticias sobre GPT-4
Presentado en marzo de 2023, el modelo GPT-4 de OpenAI fue el modelo a batir el año pasado, y todos, desde gigantes de la industria como Google hasta nuevas empresas de moda como Anthropic y Mistral, han intentado emular su desempeño.
Gemini de Google, lanzado en febrero, superó por poco al GPT-4 en algunas pruebas de rendimiento. Los modelos Claude de Anthropic, lanzados el mes pasado, también mostraron mejoras menores con respecto al modelo de OpenAI.
Pero en lugar de superar al GPT-4, los próximos modelos Llama 3 se unirán a una serie de competidores que están al mismo nivel que el producto OpenAI lanzado hace un año.
Eso no quiere decir que debamos despreciar los avances que supone Llama 3.
Jim Fan, director de investigación de Nvidia, escribió en «cambiará el cálculo para los investigadores y las nuevas empresas».
Pero está claro que todavía no ha llegado nada que supere con creces el logro de lo que Altman ya ha presentado.
Zuckerberg no parece demasiado preocupado por superar a GPT-4 todavía. el lo dijo El borde que el objetivo de Llama 3 “no era construir algo que estuviera muy por delante”. Su objetivo era llevar la IA con las capacidades de los mejores modelos actuales a plataformas como Facebook e Instagram.
Sin embargo, en enero, la compañía insinuó que su principal objetivo era superar a GPT-4 después de publicar un breve vídeo en el que explicaba que «la visión a largo plazo de Meta es desarrollar inteligencia general, de forma responsable y con una solución de código abierto». proporcionar y poner a disposición”. de todo el mundo para que todos puedan beneficiarse de él.
Queda por ver cuándo y cómo una empresa que lucha por la supremacía de la IA dará el siguiente salto en rendimiento.
Algunos en la industria, como Gary Marcus, profesor de la Universidad de Nueva York y experto en inteligencia artificial, ven signos de que los modelos están entrando en «un período de rendimientos decrecientes», lo que plantea la cuestión de si habrá otro salto generacional en el rendimiento.
Por el momento, sin embargo, está claro que Zuck y compañía quieren alcanzar a Altman.
Axel Springer, la empresa matriz de Business Insider, ha firmado un acuerdo global que permite a OpenAI entrenar sus modelos utilizando información de sus medios.
Comments