OpenRouter presentó en junio un paquete de herramientas que buscan optimizar el gasto en inteligencia artificial.
La plataforma, que reúne más de 400 modelos de 70 proveedores, apuesta por la eficiencia sin sacrificar calidad.
El objetivo es claro: que cada peso invertido rinda al máximo. Para eso, la compañía lanzó tres nuevos «server tools» diseñados para delegar tareas de forma inteligente.
La primera se llama Fusion y permite combinar respuestas de varios modelos ante una pregunta compleja.
Un panel responde en paralelo con búsqueda web y un juez sintetiza la mejor respuesta.
Así se obtiene calidad de nivel frontera sin pagar tarifas premium en cada consulta. La segunda herramienta, Advisor, pone a un modelo barato como ejecutor principal.
Ese modelo consulta a uno más potente solo cuando se traba, evitando costos innecesarios. El usuario elige qué modelo ejecuta y cuál asesora, según sus necesidades.
La tercera es Subagent, que divide tareas complejas en subtareas y las deriva a modelos más pequeños y rápidos.
El modelo grande arma el resultado final sin desgastarse en trabajo repetitivo.
Además de estas herramientas, OpenRouter sumó una API unificada de imágenes que centraliza más de 30 modelos de 8 proveedores. Cada renderizado devuelve el costo exacto en el momento.
También incorporó un servidor MCP que permite comparar precios y benchmarks desde el editor. Incluye una clave dedicada con tope de 10 dólares para hacer pruebas sin sorpresas.
Otra novedad es la Models API, que filtra el catálogo por precio, modalidad, contexto y proveedor.
Así los desarrolladores encuentran el modelo justo para cada tarea de forma programática.
En cuanto a modelos, junio trajo diez novedades destacadas. El más relevante es Claude Sonnet 5 de Anthropic, el modelo Sonnet más capaz hasta la fecha.
Ofrece un contexto de 1 millón de tokens a 2 dólares por entrada y 10 por salida. Está pensado para tareas de codificación, agentes y trabajo profesional de alto nivel.
También llegó GLM 5.2 de Z-AI, con un costo de 0,93 dólares por millón de tokens de entrada y 3 de salida. Moonshot AI presentó Kimi K2.7 Code, enfocado en programación.
Qwen 3.7 Plus de Alibaba ofrece 1 millón de contexto por 0,32 dólares de entrada y 1,28 de salida. Nvidia lanzó Nemotron 3 Ultra 550B A55B, también con 1 millón de contexto.
Google sumó dos modelos de imagen: Gemini 3 Pro Image y Gemini 3.1 Flash Image. El primero cuesta 2 dólares de entrada y 12 de salida; el segundo, 0,50 y 3 respectivamente.
Cohere presentó North Mini Code en versión gratuita, con 256 mil tokens de contexto. Nex AGI lanzó Nex N2 Pro, con 262 mil tokens a 0,25 dólares de entrada y 1 de salida.
Sakana completó la lista con Fugu Ultra, su modelo más potente, a 5 dólares de entrada y 30 de salida. Todos son accesibles con una sola clave de API.
OpenRouter procesa actualmente 100 billones de tokens por mes. La plataforma busca que el costo de «acertar» sea cada vez más bajo para sus usuarios.
Desde la empresa afirman que «el token más barato y el resultado correcto más barato no son lo mismo». Por eso, todas las novedades de junio apuntan a reducir el segundo número.
Las nuevas herramientas permiten enrutar, fusionar, escalar y delegar para que el gasto se concentre donde realmente se necesita. No se paga por capacidad ociosa.
El blog de OpenRouter también publicó análisis sobre los modelos de peso abierto que cierran la brecha con los propietarios.
Allí se detalla dónde la diferencia de precio sigue siendo real.
Otro estudio comparó once modelos en una simulación de battle royale de 30 rondas. El modelo más barato ganó más partidas, pero el recomendable para uso real fue otro.
Un tercer artículo explica cómo funciona el enrutamiento de modelos en OpenRouter.
Cada solicitud se distribuye entre más de 70 proveedores según balanceo de carga y reglas configurables.
La compañía tiene su sede en 169 Madison Avenue, Nueva York. Su comunidad activa en Discord y X sigue de cerca cada actualización.
Para quienes buscan optimizar costos en IA, OpenRouter se posiciona como una alternativa cada vez más completa.
Las herramientas de junio refuerzan esa propuesta con inteligencia aplicada al gasto.







