Tülu 3 405B desafía a DeepSeek y OpenAI: la IA open-source de EE.UU. contraataca
La IA de código abierto de EE.UU. quiere pelear con DeepSeek: ¿Tulu 3 es el salvador de Occidente?
¡Atención, Silicon Valley! Justo cuando pensábamos que la supremacía de China en inteligencia artificial era inevitable, desde Seattle nos llega una nueva esperanza:Ya puedes probar Tülu 3 405B, la última y más grande apuesta del Allen Institute for AI (Ai2). ¿Su misión? Demostrar que Estados Unidos aún puede competir en el juego de la IA sin depender de las mega-corporaciones. ¿Suena épico? Claro, pero veamos si la realidad está a la altura del discurso patriótico.
La carta de presentación de Tülu 3 405B es ambiciosa: 405.000 millones de parámetros (una cifra que da vértigo), un modelo completamente open-source, y resultados que -según Ai2- lo posicionan a la par o incluso por encima de OpenAI GPT-4o y del temido DeepSeek V3. En otras palabras, EE.UU. se ha puesto serio en la carrera de la IA generativa y no piensa dejar que China dicte las reglas del juego.
¿IA sin el control de las Big Tech? ¡Hasta parece un milagro!
Uno de los argumentos clave de Ai2 es que Tülu 3 no depende de las grandes corporaciones. Al parecer, la independencia es su gran bandera, aunque no deja de ser irónico que el instituto haya sido fundado por Paul Allen, cofundador de Microsoft. Pero, claro, eso es un pequeño detalle sin importancia, ¿verdad?
Mientras Microsoft hace negocios con DeepSeek e intenta mantener contento a OpenAI, Ai2 llega con un enfoque más académico y transparente, con acceso abierto a su código en GitHub. Su estrategia de entrenamiento se basa en el refinamiento del modelo a través de Reinforcement Learning from Verifiable Rewards (RLVR), una técnica que le da recompensas cuando acierta y lo castiga cuando se equivoca en tareas matemáticas o de comprensión de instrucciones. Es decir, al modelo le han puesto un sistema de puntos como si fuera un niño en la escuela.
¿Podrá Tülu 3 hacer temblar a DeepSeek?
La gran pregunta es si este gigante de los parámetros puede realmente competir con DeepSeek. Hasta ahora, DeepSeek ha demostrado que se puede hacer mucho con menos, desafiando la narrativa de que solo las grandes inversiones producen modelos de calidad. De hecho, sus avances en eficiencia fueron los que hicieron tambalear las acciones de las grandes tecnológicas la semana pasada. Y ahora, Ai2 parece querer demostrar que EE.UU. también puede jugar con las mismas reglas, sin necesitar un ejército de GPUs y miles de millones en infraestructura.
Por ahora, Tülu 3 405B ya está disponible para pruebas, y Ai2 ha publicado su código para que cualquiera pueda experimentarlo. Pero la gran duda persiste: ¿Es realmente una revolución o solo un intento desesperado de Occidente para no quedarse atrás?
Lo único seguro es que la competencia se ha puesto más interesante, y mientras Silicon Valley sigue tratando de asimilar que el futuro de la IA puede estar en China, Ai2 ha decidido lanzar su propio órdago. ¿Será suficiente para recuperar el liderazgo o es solo otro intento tardío de evitar lo inevitable? El tiempo -y los benchmarks- lo dirán.
No hay comentarios