GPT o1: qué es y cuáles son sus funciones principales

Esden Business School 18 de septiembre de 2024

Desde que OpenAI lanzase en noviembre de 2022 su primera versión comercial de ChatGPT, la inteligencia artificial generativa (GenAI, por sus siglas en inglés) ha irrumpido de forma vertiginosa en nuestras vidas. El desarrollo de este tipo de tecnologías se acelera a un paso sin precedentes en otros campos.

Tabla de Contenido

1. ¿Qué es GPT o1?
2. ¿Qué funciones presenta GPT o1?
3. Comparativa con modelos previos
4. Limitaciones de GPT o1
5. Rendimiento y expectativas
6. ¿Quieres aprender a usar la IA generativa en el marketing digital?

¿Qué es GPT o1?

A medida que la tecnología de IA generativa avanza, surgen versiones para cumplir con necesidades más específicas y especializadas. Un ejemplo reciente de esto es GPT o1, también conocido como OpenAI o1, un nuevo modelo que “piensa” (realmente procesa predicciones) antes de emitir un prompt. GPT o1 se ha concebido para ofrecer un enfoque más avanzado durante el proceso de razonamiento, lo que se traduce en un análisis más profundo y reflexivo de las respuestas. Esta capacidad le permite resolver problemas complejos de manera más precisa, abordando tareas que requieren un mayor nivel de reflexión, como el razonamiento científico.

Este enfoque de basado en el “let’s think step-by-step” permite que el modelo tome un poco más de tiempo en sus respuestas, pero con el beneficio de reducir errores de razonamiento detectados en modelos anteriores. Por el momento, se han lanzado dos modalidades, a saber, o1-preview y la versión más eficiente, o1-mini, aunque esta última no cuenta con un grafo de conocimiento del mundo tan extenso.

¿Qué funciones presenta GPT o1?

La saga de modelos o1, en la que OpenAI continúa trabajando, marca un avance significativo en el campo del razonamiento complejo. A continuación, se ilustran algunas de sus funciones:

Razonamiento complejo: GPT o1 está diseñado para realizar tareas de razonamiento avanzado al pensar detenidamente antes de responder. Puede generar una larga cadena interna de pensamiento (chain of thought), lo que mejora sobremanera la resolución de problemas.
Aprendizaje por refuerzo (reinforcement learning): el modelo se entrena utilizando aprendizaje por refuerzo, lo que le enseña a pensar de manera productiva y a refinar sus habilidades de razonamiento.
Programación competitiva: GPT o1 se ubica en el percentil 89 en las competencias de programación de Codeforces, una de las habilidades más demandadas actualmente por las empresas STEM.
Cadena de pensamiento: el modelo puede descomponer problemas complejos paso a paso, permitiendo un razonamiento más detallado y preciso.

Comparativa con modelos previos

La capacidad de razonar es uno de objetivos de la IA ya desde la época de los sistemas expertos a través de la codificación de reglas lógicas. Una diferencia clave entre GPT o1 y sus predecesores es su capacidad para analizar múltiples estrategias identificando errores antes de llegar a una respuesta, imitando grosso modo el proceso de pensamiento humano. GPT o1 trata de evitar, de este modo, las alucinaciones que podían ocurrir en modelos previos. El formato preview obtuvo una puntuación del 83% en la Olimpiada Internacional de Matemáticas, sobrepasando el 13% de aciertos logrado por su antecesor GPT-4o. En competiciones de código, GPT o1 ha mostrado una habilidad superior para optimizar scripts y mejorar la eficiencia de los programas desarrollados. Asimismo, la red neuronal ha logrado resultados reseñables en benchmarks de química, física y biología (GPQA).

Limitaciones de GPT o1

Las limitaciones del modelo GPT o1 se centran en varios aspectos importantes. Actualmente, el modelo GPT o1 solo está disponible en las versiones preliminares mencionadas, y su acceso está limitado a los usuarios de pago en las categorías Plus y Team. El uso de estos modelos, por el momento, está limitado de forma semanal a 30 mensajes para preview y 50 para la versión mini. Sin embargo, se espera que en las próximas semanas también esté disponible para clientes Enterprise y del sector educativo (Edu). Otra restricción significativa es que, por el momento, el modelo no es multimodal, lo que implica que solo puede procesar texto, sin la capacidad de trabajar con audio, imágenes u otros tipos de ficheros.

Rendimiento y expectativas

A pesar del revuelo mediático, los modelos actuales, como Strawberry (anteriormente conocido como Q*), no representan una amenaza para la humanidad, desmintiendo así la alarma suscitada en algunos titulares de la prensa. Strawberry, que es parte de la serie o1, ha demostrado mejoras significativas en tareas complejas, pero no supera a GPT-4o en todas las áreas, como redacción, navegación web, generación de imágenes o carga de archivos. Destaca solo en tareas que se benefician de procesos más planificados, como la resolución de problemas matemáticos o lógicos. Aunque estas capacidades se ampliarán en el futuro, por ahora, GPT o1 sigue sin incorporar características presentes en versiones anteriores. También se está trabajando en una modalidad de ChatGPT que permita seleccionar automáticamente el modelo que mejor se adecúe a un prompt dado.

Un factor crucial será la experimentación directa de los usuarios, la cual revelará el verdadero rendimiento de GPT o1, más allá de las afirmaciones propias de la monserga periodística, que en ocasiones son exageradas.

¿Quieres aprender a usar la IA generativa en el marketing digital?

Si quieres especializarte en inteligencia artificial generativa, no dudes en matricularte en nuestro Master en Marketing Digital y conviértete en uno de los perfiles profesionales más demandados por las empresas. Nuestra escuela, Esden Business School, es un centro de referencia en el que podrás aprender los fundamentos del marketing digital.