Pulso IA #65 | El ajuste
La publicación semanal de Amplify: claridad, estrategia y comunidad para ampliar tu ventaja con inteligencia artificial.
Cuatro investigadores que construyeron los modelos de Google dejaron la empresa en seis días. OpenAI reveló el chip de inferencia que lleva nueve meses diseñando en secreto con Broadcom. Las conversaciones sobre si el gasto en IA produce lo que prometía pasaron de los chats privados a los titulares de prensa. Y los modelos más capaces de Anthropic volvieron parcialmente al mercado después de dos semanas de silencio impuesto.
Ajustar no es retroceder. Pero sí indica que la fase que acaba de empezar no va a ser igual a la que termina.
Latidos de la semana
OpenAI presentó GPT-5.6 Sol — y lo que más importa de su lanzamiento no es el modelo.
OpenAI puso en marcha una vista previa limitada de GPT-5.6, una familia de tres modelos: Sol (el más capaz), Terra (rendimiento comparable al 5.5 actual a la mitad de precio) y Luna (velocidad y coste mínimos). El acceso, por ahora, está restringido a unas veinte organizaciones.
La condición para ese acceso dice más que los benchmarks: las organizaciones participantes fueron preaprobadas por el gobierno de Estados Unidos. OpenAI lleva un mes compartiendo los modelos con el ejecutivo de Washington antes de ponerlos en manos de nadie más. No hay ninguna ley que lo exija. Es una decisión unilateral de la compañía.
Lo que eso establece es algo nuevo: una ventana de coordinación voluntaria entre un laboratorio de IA privado y el gobierno antes de cada despliegue de frontera. Si se extiende como patrón, el modelo de “anunciamos y lanzamos” que ha definido el sector durante cinco años está cambiando de forma sin que nadie lo vote.
OpenAI diseñó su primer chip propio en nueve meses. El objetivo: precio.
OpenAI y Broadcom presentaron Jalapeño: el primer procesador de inferencia diseñado desde cero por OpenAI, construido en nueve meses.
Los primeros chips llegarán a producción antes de final de 2026, con despliegue a escala en la primera mitad de 2028. La narrativa que OpenAI construye con esto es clara: la compañía no solo quiere elegir qué modelos existen, sino controlar cada capa de la infraestructura que los hace correr, y usar esa posición para bajar el coste de la inteligencia de forma que ningún proveedor externo de silicio podría hacer en su lugar.
El equipo que construyó Gemini se está dispersando — y sus destinos dicen algo concreto.
En seis días, cuatro investigadores con un rol determinante en los modelos de Google anunciaron su marcha. Noam Shazeer — co-autor del transformer — a OpenAI. John Jumper — Nobel de Química 2024 por su trabajo en predicción de proteínas, investigador de DeepMind — a Anthropic. Jonas Adler, responsable de los esfuerzos de IA en código de Google, a Anthropic. Alexander Pritzel, arquitecto del preentrenamiento de Gemini, también a Anthropic.
Cuatro personas no hacen una migración. Pero cuatro en seis días, todas con roles de arquitectura, todas yendo a los dos competidores que en este momento lideran los benchmarks — eso sí es un patrón. El talento de base de los modelos no solo tiene movilidad; tiene criterio sobre dónde quiere estar. Y esta semana ese criterio señaló en una dirección que Google debería analizar con más cuidado de lo que sugieren sus comunicados corporativos.
Mythos 5 vuelve al mercado.
El 27 de junio, quince días después del bloqueo de exportación impuesto por el gobierno de Estados Unidos, Anthropic recibió autorización para restablecer el acceso a Claude Mythos 5 para aproximadamente cien organizaciones estadounidenses que operan y defienden infraestructuras críticas. Agencias gubernamentales y empresas privadas del sector de energía, agua, salud y comunicaciones.
Fable 5 — el modelo de uso general, el que afectaba a cualquier usuario individual fuera de Estados Unidos — sigue suspendido. Anthropic continúa negociando con el Departamento de Comercio.
Trump firmó un decreto ejecutivo de IA que formaliza la lógica que ya estaba ocurriendo.
El decreto “Promoting Advanced Artificial Intelligence Innovation and Security” establece tres mecanismos: un acuerdo de ciberseguridad de IA donde los laboratorios y el sector privado comparten vulnerabilidades identificadas en sus sistemas; una ventana de acceso anticipado de treinta días para que el gobierno revise los modelos de frontera antes de su despliegue a socios de confianza; y una declaración explícita de que ninguna de estas medidas crea obligaciones de licencia ni permiso para desarrollar o publicar modelos de IA.
Lo que el decreto formaliza en papel es en parte lo que OpenAI ya practicó esta semana con GPT-5.6. El quid está en si “voluntario” seguirá siéndolo cuando los modelos hagan cosas que los decretos no anticiparon.
En profundidad
La factura que no cuadraba
El término lo inventaron los propios equipos internos de las grandes empresas tecnológicas: tokenmaxxing. La idea era sencilla: la IA es tan poderosa que lo inteligente es usarla sin límite. Que los desarrolladores llenen los contextos hasta el máximo, que los agentes consulten el modelo para cada micro-decisión, que la empresa pague lo que haga falta porque el retorno va a llegar. Era la lógica del crecimiento a cualquier precio, aplicada a los tokens.
Esta semana esa lógica empezó a doblarse en público.
El CEO de Lindy, una plataforma de automatización con IA, decidió mover el cien por cien del tráfico de su empresa desde Claude de Anthropic a DeepSeek — un modelo de origen chino, de código abierto, que cuesta una fracción de precio y produce resultados que él considera comparables para los casos de uso de su negocio. Los tokens de Claude cuestan lo que cuestan, y DeepSeek cuesta menos.
No es el único. Uber, que fue noticia el trimestre pasado por haber agotado su presupuesto anual de IA en cuatro meses, implementó un sistema de niveles de acceso: nivel base de 1.500 dólares mensuales, con posibilidad de solicitar capas superiores según el caso de uso.
¿Qué está ocurriendo exactamente?
El período de 2024 y 2025 fue una anomalía de gasto. Las empresas tecnológicas — y algunas no tan tecnológicas — adoptaron la IA bajo la presión de no quedarse atrás, con presupuestos generosos y criterios de evaluación laxos.. Ese entorno de dinero fácil en IA tiene un nombre coloquial: tokenmaxxing. Y como casi todas las anomalías de gasto, estaba condenado a encontrar su límite.
El límite llegó en forma de factura. Las empresas que instalaron IA en sus flujos de trabajo a lo grande encontraron que el coste de los tokens escala de forma no lineal con el uso real — especialmente cuando los agentes de IA operan en bucles, cuando el contexto crece a lo largo de conversaciones largas, o cuando el producto está diseñado para maximizar la interacción del usuario. El modelo de negocio funcionaba mientras el gasto era fijo o predecible. Deja de funcionar cuando la factura llega y duplica lo esperado.
La respuesta del mercado ya está ocurriendo en tres frentes simultáneos:
los usuarios están eligiendo modelos más baratos (DeepSeek, los modelos de Meta, Claude Haiku o GPT-5.6 Luna en vez de los modelos de frontera para tareas que no los requieren)
los laboratorios están bajando precios y lanzando niveles más económicos (GPT-5.6 Terra, a la mitad del precio de 5.5; la presión de OpenAI para cortar precios de API)
y los equipos de ingeniería están rediseñando sus integraciones para reducir el consumo de tokens por tarea.
El siguiente ciclo de la IA va a girar mucho menos sobre qué pueden hacer los modelos y mucho más sobre cuánto cuesta hacer que produzcan algo que valga el precio. La corrección es real, pero no es el fin del sector.
Es simplemente el momento en que la inteligencia artificial deja de ser un gasto de exploración y empieza a ser un gasto que tiene que justificarse como cualquier otro.
Herramienta de la semana
HeyGen
El problema que resuelve. Para crear vídeo de calidad — un vídeo de producto, una presentación de empresa, un módulo de formación, un mensaje para clientes — normalmente necesitas cámara, iluminación, tiempo de grabación, y la disposición a aparecer en pantalla. Eso es un cuello de botella real para quien trabaja solo o con un equipo reducido, especialmente si la grabación no es parte natural de tu flujo de trabajo.
Qué es HeyGen. Una plataforma de generación de vídeo con avatares de IA. Le das un guión escrito y el sistema produce un vídeo con una persona hablando — puede ser un avatar prediseñado o una réplica creada a partir de dos minutos de vídeo de ti mismo. El resultado parece un vídeo grabado, con sincronización labial, expresión facial y entonación natural. Soporta más de cuarenta idiomas, incluyendo español, con voces regionales.
Pregunta de la semana
Esta semana, algunas de las empresas que más han invertido en IA en los últimos dos años descubrieron que la pregunta no era “¿cuánta IA usamos?” sino “¿cuánta IA podemos pagar que realmente valga lo que cuesta?”.
¿Tienes claro cuáles de las herramientas de IA que estás usando hoy justifican lo que te cuestan — en tiempo, en dinero, o en ambos?
Nos leemos la semana que viene.
— El equipo de Amplify


