La plataforma de Zendesk ayuda a las empresas a ofrecer resoluciones rápidas y precisas con menos esfuerzo, y en su núcleo hay un sistema de agentes de IA que trabaja para entender lo que un cliente necesita en ese momento específico en el que la confianza puede estar en juego, para actuar correctamente y saber cuándo escalar o hacerse a un lado.
Esta es exactamente la razón por la que los modelos fundacionales son esenciales y por lo que es crítico que una empresa como Zendesk lidere las pruebas y el uso de los modelos más recientes para mejorar y acelerar continuamente nuestras capacidades de IA más avanzadas.
Con el lanzamiento de GPT-5, vimos una oportunidad significativa para mejorar partes clave de ese sistema. Hoy, GPT-5 está en producción dentro de Zendesk Resolution Platform, impulsando conversaciones reales con clientes a través de nuestros flujos de trabajo de asistencia al agente y automatización.
“Los despliegues por etapas ayudan a garantizar que abordemos y lancemos nuevas capacidades de modelos con los más altos niveles de rigurosidad”, dijo Olivier Godement, Director de Productos Empresariales en OpenAI. “Trabajar con Zendesk en GPT-5 es el ejemplo más reciente de cómo las pruebas anticipadas y la retroalimentación nos ayudan a identificar dónde la API puede generar el impacto más significativo donde más importa para sus usuarios”.
Por qué probamos cada modelo de la misma manera
Cuando evaluamos un nuevo modelo, no buscamos simplemente superar benchmarks. Nos preguntamos si realmente mejora los resultados de resolución en el entorno real. Nosotros ejecutamos un riguroso programa de evaluación comparativa para probar y ajustar nuevos modelos como GPT-5 en tareas clave, equilibrando latencia, costo y rendimiento. Esto permite probar e implementar modelos en menos de 24 horas.
Nuestro marco de evaluación abarca los siguientes aspectos:
Precisión: ¿Puede el modelo ofrecer respuestas precisas y completas, basadas en fuentes confiables como artículos del centro de ayuda?
Resolución automatizada: ¿Aumenta el porcentaje de incidencias resueltas automáticamente sin intervención humana?
Ejecución: ¿Es capaz de seguir flujos de trabajo estructurados con alta fidelidad?
Latencia: ¿Es lo suficientemente rápido como para usarse en entornos de soporte en tiempo real?
Seguridad: ¿Evita las alucinaciones y solo actúa cuando tiene un alto nivel de confianza?
Supervisamos continuamente el rendimiento mediante métricas tanto offline como en tiempo real, garantizando mejoras en IA que sean transparentes y confiables. GPT-5 mostró avances en casi todos estos criterios. A continuación, presentamos los resultados.
GPT-5 no se implementa simplemente como un reemplazo de modelos anteriores. Es un componente dentro de una arquitectura de IA modular más amplia, diseñada para ofrecer resoluciones de forma confiable.
Usamos GPT-5 de forma selectiva en casos de uso donde demuestra un valor medible. Estos incluyen:
GPT-5 opera en conjunto con nuestro sistema de clasificación de intenciones y razonamiento. Mapeamos entradas ambiguas hacia acciones claras y utilizamos el modelo para sintetizar respuestas o ejecutar flujos de trabajo complejos, según sea necesario.
GPT-5 permite un razonamiento de nivel medio con ventanas de contexto significativamente más amplias. Esto es especialmente útil para:
En estos escenarios, priorizamos mantener la estructura conversacional, la precisión y la eficiencia del contexto. GPT-5 se desempeña de forma confiable incluso con cargas altas de tokens, lo que permite automatizar interacciones de servicio más complejas y extensas.
GPT-5 se despliega en producción con una base sólida de controles y límites diseñados para garantizar su uso seguro y confiable:
Tratamos al modelo como una herramienta cuyo comportamiento puede variar con cada uso dentro de un sistema controlado, no como un decisor autónomo. Esto es lo que nos permite implementarlo en entornos de nivel empresarial.
Integramos GPT-5 porque nos permitió resolver más problemas, más rápido y con mayor confiabilidad.
Ayudó a reducir las derivaciones de respaldo. Mejoró el rendimiento en soporte multilingüe. Ejecutó flujos de trabajo con precisión y manejó la ambigüedad con más naturalidad. Además, aceleró los ciclos de desarrollo de nuestros equipos internos en la construcción, prueba y despliegue de agentes potenciados por IA.
Cada avance en IA debe traducirse en menos conversaciones inconclusas, tiempos de resolución más cortos y una mejor experiencia para todas las partes involucradas. GPT-5 nos ayuda a lograrlo.
Seguiremos probando, ajustando e integrando nuevos modelos a medida que evolucionen. Pero nuestro enfoque seguirá siendo el mismo: usar la IA para ofrecer resoluciones en las que los clientes puedan confiar.
Para obtener información sobre la felicidad del consumidor en la era de la IA, NiCE realizó el estudio “Índice Global de Felicidad” que explora las expectativas de los clientes, los factores que impulsan la felicidad en el servicio, y cómo la Inteligencia Artificial (IA) y la automatización están transformando las experiencias. En esta muestra se ...
Ingrid Imanishi, Directora de Soluciones en NiCE, nos comparte los hallazgos del “Índice Global de Felicidad”, un estudio, realizado por NiCE, que analiza cómo la Inteligencia Artificial y la automatización están transformando la Experiencia del Cliente. La investigación incluyó 2,000 personas en México y más de 12,000 consumidores en seis mercados globales, brindando perspectivas clave ...
Los startups cuentan con una posición única para aprovechar la Inteligencia Artificial Generativa (GenIA) y utilizarla como una herramienta poderosa para innovar en sus productos y servicios. A diferencia de las grandes empresas, los startups suelen ser más ágiles, dispuestas a asumir riesgos y adaptarse rápidamente a nuevas tecnologías. Esto les permite explorar y experimentar ...
La salud física, mental y emocional de quienes lideran equipos atraviesa una crisis silenciosa. Aunque el 62 % de los líderes siente que debe estar siempre disponible, sólo un número reducido reconoce su desgaste o busca apoyo, según el estudio Work Trend Index de Microsoft. Esta presión, cuando se ignora, no sólo pasa factura al individuo: ...