Blog

Conectando agentes de voz a la telefonía con SIP trunks

Un agente de voz sin número es un chatbot. El SIP trunk es lo que lo convierte en producto telefónico. Cómo funciona el deployment BYON con SipPulse AI.

SipPulse AI - Equipo de Ingeniería25 de febrero de 20267 min de lectura
Compartir
Conectando agentes de voz a la telefonía con SIP trunks

Un agente de voz que solo vive en el navegador es una demo. En el minuto en que quieres que los usuarios lo alcancen desde un teléfono, necesitas un SIP trunk: una línea virtual que conecta tu agente a la red telefónica pública. La buena noticia es que la tecnología es madura. La menos buena es que los casos límite de codec y la capa regulatoria (atestación de caller ID, reglas por país) requieren trabajo real. Este post recorre qué es un SIP trunk, por qué elegimos Bring Your Own Number (BYON) como el único patrón de deployment que soportamos y cómo SipPulse AI envía integración SIP nativa para que el mismo agente conteste llamadas en navegador y por teléfono sin bifurcar la implementación.

Qué es un SIP trunk y por qué lo necesita el agente de voz

Un SIP trunk es una línea telefónica virtual. Usa el protocolo SIP sobre internet para entregar llamadas de voz hacia y desde la red telefónica pública conmutada (PSTN). Sin él, un agente de voz no puede hacer ni recibir una llamada real: un cliente que disca tu número no llega a ningún lado y una llamada saliente de tu agente no alcanza a nadie.

El SIP trunk hace tres cosas:

  • Enrutamiento entrante: un cliente que disca tu número aterriza en un endpoint SIP donde tu agente está escuchando
  • Origen saliente: tu agente inicia una llamada, el SIP trunk la entrega a la operadora, la operadora la enruta al destino
  • Puente de codec y señalización: capa de traducción entre el mundo de la operadora (PCMU, PCMA, SIP, RTP) y el mundo del agente de voz (Opus, WebRTC)

Para un agente de voz construido sobre WebRTC, el SIP trunk es el puente entre el mundo WebRTC y el mundo de la operadora. El puente tiene que manejar conversión de codec, DTMF para pasar a IVRs legados y señalización que satisfaga ambos lados.

Somos solo BYON, y es a propósito

SipPulse AI es BYON: Bring Your Own Number. No vendemos, alquilamos, portamos ni originamos números de teléfono. El cliente conserva el número que ya tiene con la operadora que ya tiene y configura el reenvío SIP de esa operadora hacia SipPulse AI.

Las razones:

  • Somos una plataforma de IA, no una telco. Provisionar números es un negocio aparte con licencias regulatorias propias, infraestructura de facturación y cumplimiento país por país. Hacerlo bien requiere ser operadora, y ser operadora no es lo que hace bueno a un agente de voz.
  • Tu número se queda donde está. Sin riesgo de portabilidad, sin downtime, sin riesgo de perder un número que está en tu material de marketing hace años. La operadora de registro no cambia, tu facturación no cambia y el resto de tu stack de telecom sigue funcionando.
  • Mantienes el control. Si mañana cambias de proveedor de voice AI, redireccionas el reenvío SIP de vuelta a tu destino anterior. El número es tuyo.

Para clientes que todavía no tienen número u operadora, el camino es primero contratar un proveedor SIP trunk en el país donde el número vive y luego hacer BYON a SipPulse AI. Podemos recomendar proveedores que se ajusten a necesidades específicas de país y regulación.

STIR/SHAKEN y caller ID saliente

Si tu agente de voz hace llamadas salientes, el caller ID importa. Las operadoras y apps de filtrado ahora chequean si los números salientes tienen atestación válida bajo el marco STIR/SHAKEN. Las llamadas sin atestación se marcan como spam o fraude y van a buzón de voz o se bloquean directamente.

STIR/SHAKEN atesta tres niveles:

  • Nivel A (atestación completa): la operadora verifica el número que llama y al cliente que lo usa. Es el camino más limpio a través de los filtros de spam
  • Nivel B (parcial): la operadora verifica al cliente pero no el número específico
  • Nivel C (gateway): la operadora solo reconoce que la llamada pasó por la red

En EE.UU., el mandato de la FCC empujó adopción casi universal por las operadoras, así que la atestación de Nivel A es el objetivo estándar para campañas salientes de voice AI. En Brasil el panorama es diferente: STIR/SHAKEN recién está comenzando a desplegarse y muchas operadoras locales aún no soportan atestación. Los clientes que necesitan saliente atestada en números brasileños deben contactarnos para que podamos sugerir un proveedor de SIP trunk que soporte el marco. La tecnología está en movimiento y la adopción está creciendo, pero todavía no es universal en el mercado local.

Codecs, DTMF y la realidad desordenada

El mundo SIP corre sobre PCMU (G.711 µ-law en Norteamérica) y PCMA (G.711 a-law en Europa y Brasil), más G.729 en caminos legados con ancho de banda limitado. El mundo WebRTC corre sobre Opus. El pipeline de medios del agente de voz tiene que hacer puente entre ellos de forma transparente, idealmente con aceleración por hardware para que la conversión no agregue latencia.

DTMF es el otro detalle que sorprende equipos. Cuando un cliente presiona un dígito en su teléfono, el SIP trunk entrega un evento DTMF (RFC 2833 in-band o SIP INFO out-of-band) que el agente tiene que escuchar y enrutar. Esto es crítico para cualquier agente que integra con sistemas IVR legados, autenticación basada en IVR o prompts de "presione 1 para confirmar".

Una integración SIP trunk que maneja codecs, DTMF, transcoding, jitter buffer y grabación de forma nativa es invisible cuando funciona. Cuando no funciona, cada llamada empieza con audio deformado.

Dónde encaja SipPulse AI

SipPulse AI envía integración SIP trunk nativa en la plataforma. El mismo agente de voz que contesta una llamada en navegador contesta un teléfono, con puente de codec y manejo de DTMF hechos en el pipeline subyacente de medios. Trae tu propio SIP trunk y lo cableamos en tu agente en un paso de configuración, no en un proyecto de integración de un trimestre.

Para deployments brasileños, el trunk maneja PCMA, G.729 y las reglas locales de numeración STFC. NIVA, nuestro constructor por bloques, te deja conectar prompts DTMF, flujos de IVR y bloques de agente de voz visualmente, que es exactamente el flujo que quieres al migrar un IVR existente a una experiencia de voice AI sin perder los atajos de teclado que los clientes ya conocen.

Escucha el resultado en nuestra página de demo e inspecciona la latencia por llamada en nuestro visor de telemetría de ejemplo. Para equipos listos para BYON tus números y desplegar en tráfico de producción, habla con el equipo para recorrer la configuración de reenvío SIP.

Lee también

Conclusión

Un agente de voz sin SIP trunk es un chatbot. El trunk es lo que lo convierte en producto telefónico. SipPulse AI es solo BYON por diseño: tú conservas tu número con tu operadora, nosotros conectamos vía SIP. Los detalles de ingeniería (codecs, DTMF, STIR/SHAKEN donde esté disponible) son donde se nota la madurez de producción. Prueba nuestra demo o habla con el equipo para desplegar SipPulse AI en tus números.

#agente de voz#SIP trunk#telefonía#BYON#STIR/SHAKEN#PSTN

Artículos Relacionados