OpenAI unveils Jalapeño, its first in-house inference chip with Broadcom — aimed at ~50% cheaper inference. OpenAI estrena Jalapeño, su primer chip de inferencia propio con Broadcom — apunta a inferencia ~50% más barata.
OpenAI presented Jalapeño, a custom inference chip co-designed with Broadcom, with the stated goal of cutting inference cost by ~50%. It's OpenAI's move to reduce dependence on NVIDIA and lower GPT's cost per token at scale — the same vertical-integration play SpaceX/xAI and Google already run. OpenAI presentó Jalapeño, un chip de inferencia propio co-diseñado con Broadcom, con el objetivo declarado de recortar el coste de inferencia ~50%. Es el movimiento de OpenAI para reducir su dependencia de NVIDIA y bajar el coste por token de GPT a escala — la misma jugada de integración vertical que ya corren SpaceX/xAI y Google.
After two editions of "cheap compute is fading", here's the counter-pressure: the giants are building silicon precisely to push inference cost back down. It won't hit your bill next month — it's infrastructure — but it changes the medium-term trajectory: don't lock into a multi-year AI contract assuming today's per-token price is the floor. Tras dos ediciones de "el cómputo barato se acaba", aquí está el contrapeso: los gigantes fabrican silicio justo para volver a empujar el coste de inferencia hacia abajo. No golpeará tu factura el mes que viene — es infraestructura — pero cambia la trayectoria a medio plazo: no te ates a un contrato IA multi-anual asumiendo que el precio por token de hoy es el piso.
Keep AI contracts to 12 months or add a price-review clause. The vendors are spending billions to make inference cheaper; don't sign away that future discount in a three-year lock-in. Mantén los contratos IA a 12 meses o añade cláusula de revisión de precio. Los vendors gastan miles de millones para abaratar la inferencia; no regales ese descuento futuro en un lock-in de tres años.