OpenAI anuncia un nuevo modelo que promete revolucionar la inteligencia artificial

El modelo o3 fue anunciado por OpenAI en una transmisión en vivo el viernes 20 y se considera el más avanzado hasta la fecha.

OpenAI anuncia un modelo que pretende revolucionar la inteligencia artificial y debate sobre AGI
OpenAI anuncia un modelo que pretende revolucionar la inteligencia artificial y debate sobre AGI

Los modelos lingüísticos a gran escala (LLM) se han hecho muy populares en los últimos años. Una de las aplicaciones más conocidas es ChatGPT, de OpenAI, que ha llegado a millones de usuarios en poco tiempo. Los LLM se entrenan para comprender y generar texto y tienen diversas aplicaciones, desde el análisis de texto a la generación de texto o imágenes.

Recientemente, empresas como OpenAI, Google y Facebook están combinando LLM con modelos de razonamiento (reasoning models). Los modelos de razonamiento pueden hacer deducciones lógicas y resolver problemas complejos conectando información. Recientemente, combinar lenguaje natural y razonamiento lógico es el objetivo de varias empresas que ya están proponiendo sus modelos.

El viernes 20, OpenAI anunció a través de una transmisión en vivo el lanzamiento del modelo o3, que está siendo denominado el modelo de IA más avanzado del mundo. Combina una comprensión superior de las matemáticas y la programación además de la conversación. Su arquitectura integra LLM con aprendizaje por refuerzo para integrar el procesamiento lingüístico y el razonamiento lógico.

LLM

Los LLM se basan principalmente en una arquitectura conocida como Transformer que fue propuesta por Google en 2017. Los LLM están capacitados con grandes cantidades de datos de texto, lo que hace que los modelos sean capaces de comprender y generar texto. Se realizan otras aplicaciones similares a imágenes y vídeos, abriendo aún más las posibles aplicaciones de los modelos generativos.

Con el uso de Transformers, los LLM pueden capturar patrones en el lenguaje humano al comprender las relaciones semánticas y contextuales.

Para mejorar las capacidades de los LLM, varios grupos de investigación se centran en combinar modelos de razonamiento con los LLM. De esta forma, se espera que los LLM mejoren su precisión y capacidad de generalización. Además, los modelos se están utilizando para responder preguntas específicas en las empresas y en la ciencia utilizando sus propias bases de datos al ajustar los modelos existentes.

Aprendiendo a razonar

La idea detrás de los modelos de razonamiento es imitar el proceso de razonamiento humano al resolver problemas mediante deducción e inducción. Por tanto, estos modelos se utilizan para resolver problemas matemáticos, realizar análisis científicos y contribuir en situaciones donde hay muchas variables. Debido a las muchas aplicaciones posibles, varios grupos se están centrando en mejorar las técnicas.

Los reasoning models utilizan técnicas que pueden estructurar el razonamiento, como, por ejemplo, chain-of-thought prompting, en la que los modelos deben mostrar pasos intermedios. Otra técnica es self-consistency decoding, que analiza diferentes líneas de razonamiento para seleccionar la mejor. Otros modelos estructuran cadenas jerárquicas de lógica. Además, el uso de estas técnicas con redes neuronales permite combinar el aprendizaje de patrones con el razonamiento lógico.

Modelo o3

Este viernes, OpenAI, la empresa famosa por ChatGPT, anunció su nuevo modelo de inteligencia artificial llamado modelo o3. Este modelo combina LLM con habilidades de razonamiento. Lo que más llamó la atención es la capacidad de o3 para resolver problemas de matemáticas avanzadas y razonamiento lógico. Para lograr esto, o3 fue entrenado con chain-of-thought prompting.

youtube video id=SKBG1sqdyIU

Chain-of-thought prompting divide los problemas en pasos más pequeños y explica los pasos intermedios creando una línea de razonamiento. Además, o3 mostró una mejor comprensión del código y generación de algoritmos que su predecesor o1. OpenAI también anunció que o3 logró resultados nunca antes vistos en pruebas diseñadas para cuantificar qué tan cerca estamos de la inteligencia artificial general o AGI.

¿Hemos alcanzado el AGI?

Ya que se dieron a conocer los resultados del modelo o3 y habiendo logrado realizar pruebas importantes para AGI, como ARC-AGI. Es importante tener en cuenta que estas pruebas no significan que hayamos alcanzado el AGI. El ARC está diseñado para evaluar habilidades específicas como el razonamiento abstracto, pero no conceptos como la creatividad y la comprensión emocional.

Los resultados de o3 son avances en el campo, pero aún dependen de datos previamente entrenados y reglas que controlan el aprendizaje. Aunque o3 representa un paso importante hacia AGI, es demasiado pronto para decir que hemos llegado o estamos a punto de alcanzarlo.


Referencia de la noticia:

OpenAI o3 and o3-mini—12 Days of OpenAI: Day 12