En un emocionante anuncio, el líder de OpenAI, Sam Altman, ha comunicado que la empresa lanzará un modelo de inteligencia artificial de peso abierto en los próximos meses. Este nuevo desarrollo promete ser un avance significativo en el campo de los modelos de lenguaje con capacidades de razonamiento.
Altman compartió en la plataforma X su entusiasmo por la próxima liberación de un modelo de lenguaje potente y de peso abierto. Este movimiento surge en parte como respuesta al notable éxito del modelo R1 de la empresa china DeepSeek, así como a la creciente popularidad de los modelos Llama de Meta.
Desde la aparición del modelo de DeepSeek en enero, Altman ha expresado que OpenAI se encontraba en una posición desfavorable respecto a los modelos abiertos, insinuando un cambio de rumbo. Recientemente, afirmó que la compañía ha estado considerando esta iniciativa desde hace tiempo, y que ahora es crucial avanzar en esta dirección.
Una de las motivaciones detrás de esta decisión es demostrar que OpenAI puede entrenar un nuevo modelo de manera económica, dado que el modelo de DeepSeek fue entrenado a una fracción del costo habitual de los grandes modelos de IA.
Clement Delangue, cofundador y CEO de HuggingFace, una empresa especializada en la gestión de modelos de IA abiertos, comentó a WIRED que esta noticia es extraordinaria. «Con DeepSeek, todos están reconociendo el poder de los pesos abiertos», afirmó Delangue.
Actualmente, OpenAI ofrece acceso a su inteligencia artificial a través de un chatbot y servicios en la nube. Sin embargo, modelos como R1 y Llama, que son de peso abierto, pueden descargarse y modificarse gratuitamente. Los «pesos» de un modelo se refieren a los valores internos de una red neuronal extensa, establecidos durante el entrenamiento. Los modelos de peso abierto son más económicos de utilizar y pueden adaptarse a casos de uso específicos, como el manejo de información altamente confidencial.
Steven Heidel, miembro del equipo técnico de OpenAI, compartió el anuncio de Altman y añadió que este año se lanzará un modelo que podrá ejecutarse en hardware propio. Johannes Heidecke, investigador en seguridad de IA en OpenAI, también difundió el mensaje en X, enfatizando que la compañía llevará a cabo pruebas exhaustivas para asegurar que el modelo de peso abierto no pueda ser mal utilizado fácilmente. Algunos investigadores de IA han expresado preocupación de que estos modelos podrían facilitar ciberataques o incluso el desarrollo de armas biológicas o químicas. «Aunque los modelos abiertos presentan desafíos únicos, nos guiamos por nuestro Marco de Preparación y no liberaremos modelos que consideremos que representan riesgos catastróficos», escribió Heidecke.
Además, OpenAI ha lanzado una página web invitando a desarrolladores a solicitar acceso anticipado al modelo próximo. Altman mencionó que la compañía organizará eventos para desarrolladores con prototipos tempranos del nuevo modelo en las próximas semanas.
Meta fue la primera gran empresa de IA en adoptar un enfoque más abierto, lanzando la primera versión de Llama en julio de 2023. Actualmente, hay una creciente disponibilidad de modelos de IA de peso abierto. Sin embargo, algunos investigadores señalan que Llama y otros modelos no son tan transparentes como podrían ser, ya que los datos de entrenamiento y otros detalles siguen siendo confidenciales. Meta también impone una licencia que limita la capacidad de otras empresas para beneficiarse de las aplicaciones y herramientas desarrolladas con Llama.
Este anuncio marca un paso importante en la evolución de los modelos de inteligencia artificial y su accesibilidad, prometiendo un impacto significativo en la forma en que se desarrollan y utilizan estas tecnologías en el futuro.