Microsoft Azure disponibiliza voz neural em português para desenvolvedores

Redação

Os serviços cognitivos do Microsoft Azure acabam de ganhar uma atualização para os desenvolvedores brasileiros, a Francisca, nova voz neural em português do Brasil. A Francisca apresenta a mesma prosódia (emprego correto da acentuação tônica das palavras) natural humana das outras vozes neurais do TTS no Azure - Guy (inglês americano masculino), Jessa (inglês americano feminino), Katja (alemão feminino), Elsa (italiana) e Xiaoxiao (mandarim chinesa).

Criado com um grande volume de amostras de fala, a voz da Francisca foi criada a partir de menos dados de treinamento do que seria necessário. O modelo de base aprende diferentes estilos de fala de vários alto-falantes e, por meio do aprendizado por transferência, pode facilmente adaptar seu estilo ao tipo de alto-falante desejado. Como outras vozes neurais, a Francisca pode gerar ondas de fala realistas para uma determinada entrada de texto, combinando padrões de transição de emoção e entonação na linguagem falada.

Além da capacidade de sintetizar a fala, os desenvolvedores também podem adaptar a voz para diferentes cenários com diversos estilos de voz como um tom alegre, por exemplo. Em um teste de crowdsourcing com mais de 60 falantes nativos, foram examinados 30 áudios produzidos por Francisca no estilo neutro e outros 30 no estilo alegre.

As impressões gerais foram bem classificadas e avaliaram naturalidade nas variações de ritmo, variações de afinação, tensões, pausas e inteligibilidade. A fala humana e a voz pt-BR de outro provedor de serviços em nuvem foram usadas como benchmarks. Os resultados mostraram um feedback muito positivo sobre a Francisca nos estilos neutro (4,44) e alegre (4,38).

Fonte: Canaltech

Trending no Canaltech: