Blog

Conectando agentes de voz à telefonia com SIP trunks

Um agente de voz sem número é um chatbot. O SIP trunk é o que o transforma em produto de telefone. Como funciona o deployment BYON com SipPulse AI.

SipPulse AI - Equipe de Engenharia25 de fevereiro de 20266 min de leitura
Compartilhar
Conectando agentes de voz à telefonia com SIP trunks

Um agente de voz que só vive no navegador é demo. No minuto em que você quer que os usuários cheguem nele pelo telefone, precisa de um SIP trunk: uma linha virtual que conecta o agente à rede pública de telefonia. A boa notícia é que a tecnologia é madura. A não tão boa é que os edge cases de codec e a camada regulatória (atestação de caller ID, regras por país) dão trabalho. Este post caminha pelo que é um SIP trunk, por que escolhemos Bring Your Own Number (BYON) como o único padrão de deployment que suportamos e como o SipPulse AI entrega integração SIP nativa para que o mesmo agente atenda navegador e telefonema sem dois códigos.

O que é um SIP trunk e por que o agente precisa

Um SIP trunk é uma linha de telefone virtual. Usa o protocolo SIP sobre a internet para entregar chamadas de voz de e para a rede pública de telefonia (PSTN). Sem ele, um agente de voz não pode fazer nem receber chamada real: o cliente que disca o número não chega a lugar nenhum, e uma ligação de saída do agente não alcança ninguém.

O SIP trunk faz três coisas:

  • Roteamento de entrada: o cliente que disca o seu número cai num endpoint SIP onde o agente está escutando
  • Origem de saída: o agente inicia uma chamada, o SIP trunk entrega à operadora, a operadora roteia ao destino
  • Ponte de codec e sinalização: camada de tradução entre o mundo da operadora (PCMU, PCMA, SIP, RTP) e o mundo do agente de voz (Opus, WebRTC)

Para um agente de voz construído em WebRTC, o SIP trunk é a ponte entre o mundo WebRTC e o mundo da operadora. A ponte precisa lidar com conversão de codec, DTMF para passagem em URAs legadas e sinalização que satisfaça os dois lados.

Somos BYON apenas, e de propósito

O SipPulse AI é BYON: Bring Your Own Number. Não vendemos, alugamos, portamos nem originamos números de telefone. O cliente mantém o número que já tem na operadora que já tem e configura encaminhamento SIP dessa operadora para o SipPulse AI.

As razões:

  • Somos uma plataforma de IA, não uma tel​co. Provisionar número é um negócio separado com licenças regulatórias próprias, infraestrutura de faturamento e compliance país a país. Fazer bem requer ser operadora, e ser operadora não é o que faz um agente de voz ficar bom.
  • Seu número fica onde está. Sem risco de portabilidade, sem downtime, sem risco de perder um número que está no seu material há anos. A operadora de registro não muda, o faturamento não muda e o resto do seu stack de telecom continua funcionando.
  • Você mantém controle. Se amanhã você troca de fornecedor de voice AI, redireciona o encaminhamento SIP de volta para o destino antigo. O número é seu.

Para clientes que ainda não têm número ou operadora, o caminho é primeiro contratar um provedor SIP trunk no país onde o número mora e depois fazer BYON para o SipPulse AI. Podemos recomendar provedores que atendem necessidade específica de país e regulação.

STIR/SHAKEN e caller ID de saída

Se o agente faz chamadas de saída, caller ID importa. Operadoras e apps de bloqueio agora checam se números de saída têm atestação válida no framework STIR/SHAKEN. Chamadas sem atestação são flegadas como spam ou fraude e vão para caixa postal ou são bloqueadas de vez.

STIR/SHAKEN atesta em três níveis:

  • Nível A (atestação completa): a operadora verifica o número chamador e o cliente que o usa. É o caminho mais limpo pelos filtros de spam
  • Nível B (parcial): a operadora verifica o cliente mas não o número específico
  • Nível C (gateway): a operadora só reconhece que a chamada passou pela rede

Nos Estados Unidos, o mandato da FCC empurrou adoção quase universal das operadoras, então atestação Nível A é o alvo padrão para campanhas de voice AI de saída. No Brasil o cenário é outro: STIR/SHAKEN está começando a entrar no ar, e muitas operadoras locais ainda não suportam atestação. Clientes que precisam de saída atestada em números brasileiros devem entrar em contato para que possamos sugerir um provedor de SIP trunk que suporte o framework. A tecnologia está em movimento e a adoção está crescendo, mas ainda não é universal no mercado local.

Codecs, DTMF e a realidade bagunçada

O mundo SIP roda em PCMU (G.711 µ-law na América do Norte) e PCMA (G.711 a-law na Europa e no Brasil), mais G.729 em caminhos legados com banda limitada. O mundo WebRTC roda em Opus. O pipeline de mídia do agente precisa fazer a ponte de forma transparente, idealmente com aceleração por hardware para não adicionar latência.

DTMF é o outro detalhe que surpreende times. Quando o cliente pressiona um dígito no telefone, o SIP trunk entrega um evento DTMF (RFC 2833 in-band ou SIP INFO out-of-band) que o agente precisa escutar e rotear. Isso é crítico para qualquer agente que integra com URA legada, autenticação por URA ou prompts de "digite 1 para confirmar".

Uma integração SIP trunk que lida com codecs, DTMF, transcoding, buffer de jitter e gravação de forma nativa é invisível quando funciona. Quando não funciona, toda chamada começa com áudio embolado.

Onde o SipPulse AI se encaixa

O SipPulse AI ship integração SIP trunk nativa na plataforma. O mesmo agente de voz que atende chamada no navegador atende telefonema, com ponte de codec e tratamento de DTMF feitos no pipeline de mídia. Traga o seu SIP trunk e a gente liga ao agente num passo de configuração, não num projeto de integração de um trimestre.

Para implantações brasileiras, o trunk trata PCMA, G.729 e as regras locais de numeração STFC. O NIVA, nosso construtor em blocos, deixa você conectar prompts DTMF, fluxos de URA e blocos de agente de voz visualmente, que é exatamente o workflow quando se migra uma URA existente para uma experiência de voice AI sem perder os atalhos de teclado que os clientes já conhecem.

Teste o resultado na página de demo e inspecione a latência por chamada no nosso visualizador de telemetria de exemplo. Para times prontos para BYON dos seus números e deployar em tráfego real, fale com o time para caminhar pelo setup de encaminhamento SIP.

Leia também

Conclusão

Um agente de voz sem SIP trunk é chatbot. O trunk é o que o torna produto de telefone. O SipPulse AI é BYON apenas, por desenho: você mantém o número com a operadora, a gente conecta via SIP. Os detalhes de engenharia (codecs, DTMF, STIR/SHAKEN onde disponível) são onde a prontidão para produção aparece. Teste a demo ou fale com o time para deployar o SipPulse AI nos seus números.

#agente de voz#SIP trunk#telefonia#BYON#STIR/SHAKEN#PSTN

Artigos Relacionados