OpenAI ha dado un gran paso en el campo de la inteligencia artificial con el lanzamiento de un nuevo modelo conocido como OpenAI o1, también conocido como ‘Strawberry’. Este modelo supone un cambio de dirección en el desarrollo de la IA, ya que el tamaño no es el único factor determinante para el avance de esta tecnología.
El año pasado, OpenAI presentó GPT-4, un modelo que aumentó drásticamente el tamaño de sus redes neuronales. Sin embargo, el legado de OpenAI o1 indica una evolución en las habilidades de razonamiento lógico. A diferencia de otros modelos que tienen la capacidad de generar respuestas instantáneamente, o1 es capaz de razonar y pensar en voz alta, de la misma manera que lo tendría que hacer un humano antes de llegar a una conclusión.
Mira Murati, directora de tecnología de OpenAI, explica que este modelo no pretende sustituir al GPT-4, sino que lo complementa. Actualmente, la compañía está trabajando en GPT-5, que será significativamente más grande que su predecesor. Murati deja claro que hay dos paradigmas en juego: el de la escala y este nuevo enfoque de razonamiento, y la idea es integrarlos.
Los modelos de lenguaje, como los modelos de lenguaje grande (LLM), funcionan con redes neuronales masivas entrenadas con cantidades masivas de datos. Aunque domino las habilidades lingüísticas y lógicas, a menudo encuentro dificultades con problemas aparentemente simples, como operaciones matemáticas básicas. OpenAI o1 utiliza el aprendizaje como referencia para mejorar sus habilidades de razonamiento y brindar comentarios positivos o negativos en función de la precisión de sus respuestas. Este tipo de aprendizaje ha demostrado ser eficaz en aplicaciones como el diseño de chips y la creación de chatbots más avanzados.
Mark Chen, vicepresidente de investigación de OpenAI, demostró el potencial de O1 para resolver problemas complejos que GPT-4 no puede, incluidas preguntas de química y problemas matemáticos complejos. Parece que el nuevo modelo aprende a razonar de forma autónoma, en lugar de simplemente imitar el pensamiento humano, como lo habían hecho los modelos anteriores.
En términos de rendimiento, OpenAI o1 ha demostrado ser superior en varias áreas como codificación, matemáticas, física, biología y química. Por ejemplo, en una prueba de matemáticas para estudiantes, GPT-4 resolvió el 12% de los problemas, mientras que 1 obtuvo un impresionante 83%.
Sin embargo, el nuevo modelo también tiene desventajas. Es más lento que GPT-4 y no se puede buscar en Internet, lo que limita sus capacidades en algunas áreas. La mejor parte del razonamiento del LLM es un tema interesante en crecimiento en los resultados de búsqueda y competidores como Google están explorando temas similares.
OpenAI cree que su nuevo modelo puede contribuir a un comportamiento más seguro que se alinee con las normas sociales. Murati señala que al razonar sobre las consecuencias de sus acciones, o1 puede evitar causar resultados dañinos, lo que podría conducir a una IA menos peligrosa.
Expertos en inteligencia artificial como Oren Etzioni destacan la importancia de introducir modelos para resolver problemas complejos y utilizar las herramientas adecuadas. A pesar de los avances, persisten dudas sobre las ‘alucinaciones’ y la veracidad de la información generada.
Chen concluyó que el enfoque de razonamiento no sólo es emocionante, sino que también promete hacer que la IA sea más accesible y asequible, en línea con la misión de OpenAI de democratizar el acceso a la IA.