Mundo, 25 de jul 2024 (ATB Digital).- Los modelos de lenguaje más avanzados del mercado, los motores que hacen posible la creación de las modernas aplicaciones de inteligencia artificial como ChatGPT, tienen una algo en común. Son modelos cerrados. Se entrenan y ejecutan en los servidores de las compañías que los crean comoOpenAI, Google o Anthropic, que invierten una enorme cantidad de recursos para hacerlos funcionar y guardan con celo el acceso a su tecnología.
Existen modelos abiertos, alternativas que es posible descargar y ejecutar de forma local o cuyo código y método de entrenamiento son públicos, pero hasta ahora, este tipo de modelos estaba lejos de las capacidades de las alternativas cerradas.
Metaha lanzado este martes una nueva generación de su modelo de lenguaje Llama que, asegura, rompe con este esquema. Llama 405B, la versión más avanzada en esta nueva generación, puede descargarse y ejecutarse en un servidor propio, como las versiones anteriores, o modificarse o afinarse para las tareas que cada usuario necesita.
El modelo, sin embargo, ha sido capaz de igualar o superar a algunos de los modelos más avanzados de OpenAI o Anthropic en varias pruebas de conocimiento general, generación de código, razonamiento y matemáticas.
“Es el primer modelo abiertamente disponible que rivaliza con los mejores modelos de IA”, explican desde la compañía. 405B requiere de recursos más avanzados de lo que puede proporcionar un ordenador corriente. Está pensado para ejecutarse en servidores especialmente diseñados para aplicaciones de inteligencia artificial, con enorme cantidades de memoria de disponible.
Junto a este modelo, no obstante, Meta ofrece también una versión de 8.000 millones de parámetros y otra de 70.000 millones de parámetros (405B, como su nombre da a entender, opera con 405.000 millones de parámetros) que sí pueden ejecutarse en equipos más modestos, incluyendo ordenadores personales de gama alta con una avanzada GPU.
Éstos se lanzaron al mercado en abril pero se han actualizado con avances importantes, como el soporte multilenguaje y una ventana de contexto mucho mayor (es lo que permite que el modelo sea capaz de “recordar” una conversación).
Mark Zuckerberg, fundador y presidente de Meta, considera que la estrategia de usar modelos de lenguaje abiertos terminará por conquistar el mercado. En una extensa publicación en la web de la compañía, equipara la situación al nacimiento de Linux.
“En los primeros días de la computación de alto rendimiento, las principales empresas tecnológicas de la época invirtieron mucho en el desarrollo de sus propias versiones de código cerrado de Unix. Creo que la IA se desarrollará de manera similar. Hoy en día, varias empresas están desarrollando modelos cerrados líderes. Pero el código abierto está terminando rápidamente la brecha que existe”, comenta Zuckerberg.
Meta comenzará a usar estos modelos en su propia inteligencia artificial, Meta AI, que está integrada en sus principales redes sociales (Facebook, Instagram y WhatsApp) aunque alternará entre el modelo de 405.000 millones de parámetros con el de 70.000 millones. Meta AI empezará a actualizarse en las próximas semanas, y estará disponible en 22 nuevos países, incluyendo varios de habla hispana, aunque de momento España no tendrá acceso.
Fuente: El Mundo