Aprimoramos o envolvimento do usuário em conversas com vozes naturais de alta qualidade.
Nossa solução Text-To-Speech (TTS) pode ser amplamente usada em aplicativos como assistentes virtuais, audiolivros, ferramentas de acessibilidade e sistemas automatizados de atendimento ao cliente.
Em pesquisa o MOS comparativo foi positivo para este modelo. Também o fator tempo real quando usado em uma RTX3090 é de 0,07, um dos mais rápidos do mercado, muito apropriado para bots de voz.
Nosso modelo retém bem a entonação e os sentimentos da conversa, como tristeza e felicidade. Este modelo pode ser executado em instância ou sem servidor para atraso mínimo de rede.
Nos benchmarks, o sistema gerou áudios com qualidade superior às gravações originais. CMOS +0,28
Alta velocidade para uso com agentes de voz. Fator de tempo real de 0,17
Execute em sua própria instância com alta privacidade
Oferecemos drivers UniMRCP gratuitos. Isso significa que você pode usar drivers nativos Asterisk e FreeSwitch e pode dar suporte a implementações Cisco e Avaya
Podemos produzir vozes personalizadas com um pequeno conjunto de áudio personalizado, ideal para idiomas com poucos recursos
Temos APIs REST com exemplos em Curl, Python e Node
Fale com nossos especialistas.
Produtos