- Marketiable
- Posts
- GPT-4.5: El "fracaso" de OpenAI que en realidad es brillante
GPT-4.5: El "fracaso" de OpenAI que en realidad es brillante
Por qué los críticos están equivocados y Sam Altman está jugando ajedrez 5D mientras todos juegan damas


🕑 Tiempo de lectura: 5 minutos
Hace unos días te conté en la newsletter de la semana sobre el lanzamiento de GPT-4.5, y vi varios comentarios divididos, entre algunos que celebraban esta noticia y por otro lado, siendo la gran mayoria, calificandolo como un fracaso.
De hecho, cuando OpenAI lanzó GPT-4.5 la semana pasada, las reacciones no se hicieron esperar. Los titulares hablaban de "decepción", "retroceso" y "modelo subóptimo". Los expertos técnicos señalaban sus benchmarks mediocres y su precio exorbitante.
Pero creo que todos están mirando el punto equivocado.
Lo que estamos presenciando no es un error de OpenAI. Es quizás su movimiento más brillante hasta la fecha.
Los números que asustan (pero no deberían)
Vamos con los hechos: GPT-4.5 cuesta $75 por millón de tokens de entrada y $150 por millón de tokens de salida. Esto lo hace aproximadamente:
25 veces más caro que Claude 3.7 Sonnet para tokens de entrada
10 veces más caro que Claude 3.7 Sonnet para tokens de salida
150-300 veces más caro que DeepSeek V3

En cuanto a benchmarks, GPT-4.5 pierde frente a modelos lanzados hace meses en métricas como GPQA, AIME 2024 y SWE-bench Verified.

Las diferencias: Base Models vs. Reasoning Models
Para entender lo que está sucediendo, necesitamos separar dos conceptos fundamentales:
Modelos base (Pre-entrenados): Son como el sistema operativo sobre el cual se construye todo lo demás. Tienen conocimiento general del mundo y habilidades lingüísticas fundamentales.
Modelos de razonamiento: Son como aplicaciones especializadas, entrenadas sobre un modelo base para resolver problemas complejos de matemáticas, ciencias o programación.
Lo que OpenAI ha lanzado con GPT-4.5 no es un modelo de razonamiento como Claude 3.7 Sonnet o DeepSeek-R1. Es un modelo base masivo, probablemente compuesto por 10-15 billones de parámetros totales, que servirá como cimiento para el futuro GPT-5.
Elevando el suelo, no el techo
La frase clave del sistema card de OpenAI es:
"GPT-4.5 es nuestro siguiente paso en escalar el paradigma de aprendizaje no supervisado."
Esto es crucial y fácil de malinterpretar. No están intentando superar a nadie en benchmarks de razonamiento. Están fortaleciendo los cimientos.
Es como si en lugar de construir un rascacielos cada vez más alto sobre una base inestable, decidieran reforzar primero los cimientos para poder construir algo verdaderamente monumental después.
El error de perspectiva: El punto vs. La trayectoria
El problema con gran parte del análisis actual es que evalúa GPT-4.5 como un punto estático (sus benchmarks actuales) en lugar de como parte de una trayectoria (lo que permite construir en el futuro).
Usando una analogía humana: GPT-4.5 es como un bebé recién nacido con genética brillante, comparado con modelos como Claude 3.7 que son adultos bien educados pero sin el mismo potencial genético. Claro que hoy elegirías al adulto para resolver problemas, pero ese bebé eventualmente lo superará de lejos.
Lo que hace especial a GPT-4.5, según los primeros usuarios y el propio Andrej Karpathy (ex Director de AI en Tesla y miembro fundador de OpenAI), son cualidades que no aparecen en ningún benchmark tradicional:
Inteligencia emocional mejorada
Creatividad más auténtica y menos formulaica
Capacidad de sorprender con perspectivas novedosas
Sentido del humor más natural
Respuestas menos predecibles y más humanas

Estas cualidades son precisamente lo que necesita un modelo para sentirse genuinamente inteligente, en lugar de simplemente competente en resolver problemas específicos.
La paradoja de las preferencias
Un dato fascinante es que cuando Karpathy realizó pruebas ciegas comparando GPT-4 con GPT-4.5, la mayoría de los usuarios prefirieron el modelo anterior. Esto podría parecer una mala señal, pero como señala él mismo:
"No me sorprendería si la gente generalmente prefiriera GPT-4/GPT-4o a GPT-4.5. Es lo que deberías esperar si GPT-4.5 fuera mejor. Después de todo, la gente prefiere la poesía mediocre generada por IA a la poesía humana."
Es lo que él llama "la tiranía del evaluador de bajo gusto": las innovaciones sutiles suelen ser apreciadas primero por quienes tienen un paladar más refinado para detectar calidad.
La estrategia de mercado a largo plazo
Con 400 millones de usuarios activos mensuales, OpenAI tiene una ventaja competitiva abrumadora en el mercado de consumo de IA. Sam Altman está apostando a que el factor diferencial a largo plazo no será resolver problemas de matemáticas o programación (que eventualmente todos los modelos harán bien), sino crear una experiencia emocionalmente convincente.

GPT-4.5 es una pieza de Lego en la construcción del modelo definitivo. No se trata de que sea el mejor en todo, sino de que aporte las cualidades humanas que otros modelos no tienen.
Hay una cita del poeta Robert Frost que captura perfectamente lo que están intentando superar con GPT-4.5:
"No hay sorpresa para el escritor, no hay sorpresa para el lector."
La escritura generada por IA se siente plana porque los modelos de lenguaje están diseñados para seleccionar el token más probable, en lugar de ocasionalmente elegir uno menos probable pero más interesante o sorprendente.
GPT-4.5 parece estar dando pasos incipientes para habitar ese terreno intermedio entre lo predecible y lo absurdo, donde florece la verdadera creatividad humana.
¿Qué esperar de GPT-5?
Si GPT-4.5 es el trampolín para GPT-5, ¿qué podemos anticipar?
Un modelo que combine la profundidad de conocimiento y creatividad de GPT-4.5
Las capacidades de razonamiento de los modelos o1/o3
Posiblemente, una eficiencia computacional mejorada que lo haga viable económicamente
Una experiencia conversacional que finalmente cruce el umbral de "sentirse humana"
OpenAI podría estar cerca de lo que han buscado desde el principio: un sistema que piense como un humano y no solo como una calculadora.

7
Conclusión: La visión a largo plazo
Mientras los competidores pelean por liderar en benchmarks STEM, Sam y su equipo estan jugando un juego completamente diferente. GPT-4.5 no es un producto final; es un escalón necesario en una escalera mucho más alta.
Como leí por ahí, GPT-4.5 es el paso atrás que das para ganar impulso antes de un gran salto y cuando llegue ese salto en forma de GPT-5, todos entenderemos por qué el paso atrás era necesario.
Reflexión personal
Como creador de contenidos sobre IA, he visto cómo los ciclos de hype y decepción distorsionan nuestra capacidad de ver el panorama completo. Siempre es tentador evaluar cada lanzamiento como un evento aislado, pero la inteligencia artificial es un maratón, no un sprint.
Lo que estamos presenciando con GPT-4.5 es un recordatorio de que las innovaciones más importantes a veces parecen pasos laterales o incluso retrocesos, hasta que el siguiente avance revela su verdadero propósito.
¿Qué opinas sobre GPT-4.5? ¿Crees que OpenAI está siguiendo la estrategia correcta? Me encantaría conocer tu perspectiva en los comentarios.
🚀 Links interesantes
📕 Lo que estoy leyendo
Acabo de terminar Sapiens de Yuval Noah Harari, gran libro. Me lo prestaron hace unos 2 meses y por fin pude terminarlo.
El libro trata de la historia de la humanidad contada desde que empezamos siendo unos simios y cómo fuimos evolucionando a través de hitos históricos que nos fueron marcando.
Me quedo con la forma entretenida de contar historias de Yuval y cómo argumenta su punto de vista con factos. Por ejemplo, ¿sabían que el trigo fue uno de los primeros alimentos de la humanidad pero que tambien reflejó la mala alimentación de los primeros humanos?
Ahora pensaré antes de comer trigo.
📕 Lo que estoy aprendiendo
Como sabrás estoy muy enfocado en crear contenido 100% de IA y mi reto este año, más allá de solo especializarme en prompts, es de crear casos de uso factibles y escalables con IA.
Algunos de los proyectos que pude crear en 3 meses:
Un agente para analizar grabaciones de llamadas usando OpenAI
Un agente conectado a la API de OpenAI para analizar landing pages
Un wrap de ChatGPT pero con información propia, para el trabajo
Estos casos de uso puedes hacerlos usando Make o n8n. Este ultimo estoy interesado más en aprender. Si sabes usarlo y/o tienes conocimiento técnico en IA, hablemos por aquí.
📈 Building in public
TikTok: 219,461 seguidores (+240 nuevos últimos 7 días)
Newsletter: 1421 suscriptores
Telegram: 2600 miembros (Pensando seriamente en migrar a WhatsApp)
Proyectos:
Primer curso de IA (esto es lo que más me emociona del Q2)
Retomar podcast (estoy haciendo research de nuevos invitados)