OpenRouter lanza seguridad centralizada y voz para desarrolladores de IA

Escuchar nota

OpenRouter, la plataforma de enrutamiento de modelos de IA, presentó en mayo funciones de seguridad y audio. La empresa también sumó 20 modelos nuevos a su catálogo.

La compañía con sede en Nueva York anunció su ronda de financiamiento Serie B por 113 millones de dólares. La inversión está liderada por CapitalG, el fondo de Alphabet.

La plataforma ya supera los 100 billones de tokens procesados por mes. Esto marca un crecimiento significativo en el uso de inteligencia artificial.

Seguridad y control centralizado

La función estrella se llama Workspace Guardrails, un sistema de seguridad y gobernanza centralizada. Permite establecer límites de gasto por miembro y por clave API.

Los equipos pueden bloquear tráfico a modelos y proveedores específicos. También pueden forzar la retención cero de datos y redactar información personal antes de enviarla.

La herramienta detecta ataques de inyección de instrucciones con más de 30 patrones OWASP. Todo se configura sin necesidad de cambiar una sola línea de código.

Las reglas pueden aplicarse a claves y miembros específicos del workspace. Esto da un control granular sobre la seguridad de cada solicitud.

Audio y voz nativos

OpenRouter lanzó APIs de voz para texto a voz y voz a texto. Los desarrolladores usan la misma clave API y facturación que ya tienen.

El servicio de voz a texto funciona con Whisper, GPT-4o Mini Transcribe y Voxtral. La conversión de texto a voz expone las voces disponibles en la API de modelos.

Ambos servicios incluyen failover automático entre proveedores y paso de errores upstream. No requieren configuración adicional ni nuevas integraciones.

Fusión de modelos y código

Model Fusion permite enviar una misma instrucción a varios modelos en paralelo. Luego sintetiza las respuestas en una única respuesta de mayor calidad.

La función funciona como plugin de API, herramienta de servidor y en el compositor del chat. El desarrollador obtiene un conjunto de modelos sin depender de uno solo.

Pareto Code Router permite definir un puntaje mínimo de calidad de código. La plataforma enruta automáticamente al modelo más barato que cumpla ese estándar.

Los equipos pueden configurar un nivel de calidad de código por defecto en cada workspace. Esto optimiza costos sin sacrificar rendimiento en tareas de programación.

Modelos privados para empresas

Private Models permite enrutar modelos personalizados, ajustados o dedicados a través de la API estándar.

Estos modelos reciben el mismo enrutamiento, guardianes y facturación que los públicos.

La función está disponible exclusivamente en el plan Enterprise. Las empresas mantienen el control total sobre sus modelos sin perder las ventajas de la plataforma.

Nuevos controles y observabilidad

Las claves API con lista de permisos ahora bloquean solicitudes no autorizadas con error 403. Antes solo registraban la actividad sin bloquear.

Llegó una API para gestionar claves de proveedores externos (BYOK) en múltiples workspaces. Las claves se agrupan por prioridad y se reordenan con arrastrar y soltar.

También se sumó una API para destinos de observabilidad como Datadog, Langfuse y LangSmith. Se puede configurar retención cero de datos por proveedor.

Los guardianes de seguridad pueden copiarse entre workspaces con solo unos clics. Esto estandariza las políticas de seguridad en toda la organización.

Comparación y preset de modelos

La nueva página de comparación permite evaluar hasta cinco modelos lado a lado. Muestra precios, longitud de contexto y benchmarks con gráficos por proveedor.

La función Highlight best resalta el mejor modelo en cada métrica. Los gráficos están codificados por colores según inteligencia, codificación y capacidades agénticas.

La API de Presets permite versionar un preset directamente desde el cuerpo de una solicitud. Ahora incluye skins para Anthropic Messages y Responses, con SDKs en TypeScript y Python.

Herramientas con intervención humana

Llegaron herramientas de human-in-the-loop para el SDK de agentes. Pausan la ejecución y esperan entrada humana cuando el agente necesita un juicio intermedio.

La sesión sticky mantiene las solicitudes con el mismo session_id en el mismo proveedor y modelo. Esto mejora el caché entre turnos de conversación.

El enrutador automático ahora tiene un dial de 0 a 10 para controlar el equilibrio costo-calidad. Reemplaza el interruptor binario anterior con un control más preciso.

La pestaña Requests en los registros permite filtrar por ID de solicitud y usar atajos de tiempo. Facilita la depuración y el análisis detallado de cada petición.

Veinte modelos nuevos

En mayo se lanzaron 20 modelos que abarcan texto, voz, imagen, video y código. Entre ellos están Claude Opus 4.8, Gemini 3.5 Flash, Grok 4.3 y Qwen3.7 Max.

También se sumaron Grok Imagine Video y las versiones Recraft V3, V4 y V4 Pro. La plataforma continúa expandiendo su oferta multimodal para desarrolladores.

Compartir esta noticia: