All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Negócios
Notícias

Como funciona a Camila, IA humanizada da AWS que converte texto em voz

Aplicação alia Inteligência Artificial e Machine Learning para garantir maior fluência no texto e melhorar a experiência do usuário

A Amazon Web Services (AWS) anuncia o lançamento da Camila, a primeira voz neural brasileira do Amazon Polly, serviço de conversão de texto em voz que utiliza tecnologia Neural Text to Speech (NTTS), baseada em Inteligência Artificial e Machine Learning. Com o NTTS, a ferramenta apresenta uma voz humanizada, com capacidade de identificar pontuações e oferecer maior fluência aos textos.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Segundo o IBGE, há no Brasil mais de 6,5 milhões de pessoas com deficiência visual, sendo 582 mil cegas e 6 milhões com baixa visão. Além disso, segundo dados do mesmo instituto, cerca de 11,3 milhões de brasileiros são analfabetos.

A legislação brasileira prevê, na Lei n° 13.146, de 6 de julho de 2015, a obrigatoriedade das empresas brasileiras, ou com operações no país, assim como de organizações governamentais, garantir o acesso à informação em seus sites. O modo que as instituições encontraram para garantir esse direito constitucional foi a implantação de conversores de texto em áudio. Porém, de modo geral, essas aplicações possuem um tom de voz robótico por não reconhecer pontuações, dificultando a imersão na mensagem e, consequentemente, seu entendimento.

Além de melhorar a experiência de pessoas que dependem de conversão de texto em voz, o Amazon Polly também está disponível em inglês e espanhol e, em conjunto com outros serviços da AWS, como o Amazon Translate, permite disponibilizar conteúdo online em texto e voz em outros idiomas com apenas um clique.

Como funciona a tecnologia:

Soluções como Text to Speech (TTS – texto para voz, em português) são possíveis graças às tecnologias de Machine Learning (Aprendizado de Máquinas) e Inteligência Artificial. O TTS funciona assim:

1. A inteligência artificial faz a leitura de um texto, sintetizando seu conteúdo e separando sílabas;
2. Depois que são separadas, as sílabas são relacionadas com seus fonemas pela Inteligência Artificial (IA);
3. A IA conecta as partes sintetizadas do texto, para que as frases sejam construídas de forma sonora.

Mesmo sendo avançada, o TTS ainda tem dificuldades para identificar pontuações e variações de tom de voz, o que resulta em um som mais artificial. Isso acontece porque há intervalos entre cada fonema.

Em busca de maior naturalidade e uma experiência melhor para os usuários, a AWS desenvolveu o Neural Text to Speech (NTTS), presente agora no Amazon Polly, permitindo vozes naturais e humanizadas. Esse é o caso da Camila, voz que segue o processo do TTS, mas traz uma camada extra de inteligência artificial. Essa etapa extra de AI reduz os intervalos entre os fonemas e auxilia na identificação de pontuação e timbre do som, criando uma experiência de áudio com mais fluidez e naturalidade.

O Amazon Polly com NTTS está disponível em diversos idiomas, com destaque para Português (Camila), Espanhol (Lupe) e Inglês com duas vozes (Joanna e Matthew). A tecnologia permite que um mesmo conteúdo possa ser lido por NTTS em mais de uma língua.

Existem diversas empresas especializadas em aplicar esta tecnologia, como é o caso da Audima, uma startup brasileira focada em inclusão digital para pessoas com limitações visuais e de leitura.

Com clientes como o Arquivo Nacional do Ministério da Justiça, o Instituto Ronald McDonald e o Portal Minha Vida, os serviços da startup permitem incluir uma ferramenta em sites que transmite em som os conteúdos escritos. Usuários com deficiência visual ainda podem controlar essa funcionalidade com comandos pré-definidos no teclado, para iniciar ou pausar o áudio.

Next Você está preparado para ser um profissional ágil? »
Previous « Os 6 crimes cibernéticos mais comuns na Black Friday
Share
Published by
Redação
7 anos ago

    Related Post

  • Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais
  • Se o Brasil não organizar seus dados culturais, outro fará isso por nós, alerta Jorge Brivilati
  • CBYK nomeia Maurício Matsuda como novo CEO

Recent Posts

  • Notícias

83% dos CIOs já adiaram projetos estratégicos por restrições de orçamento

A pressão por controle de custos vem alterando a dinâmica das áreas de tecnologia nas…

1 semana ago
  • Estudos

Fintechs brasileiras captam US$ 2,77 bi em 2025 e entram em nova fase de maturidade

O mercado brasileiro de fintechs passou por uma transformação no perfil dos investimentos em 2025.…

1 semana ago
  • Notícias

Sioux aposta em IA e dados para nova fase de experiências digitais e expande atuação para a Europa

O avanço da inteligência artificial e o uso estratégico de dados vêm transformando a forma…

1 semana ago
  • Artigos

Qual é o risco do desenvolvimento de software com IA?

Por Ramon Ribeiro Quase metade do código produzido por assistentes de inteligência artificial contém vulnerabilidades…

1 semana ago
  • Notícias

Se o Brasil não organizar seus dados culturais, outro fará isso por nós, alerta Jorge Brivilati

Peça a um modelo de inteligência artificial que gere a imagem de uma cidade, sem…

1 semana ago
  • Notícias

Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais

O IT Forum apresenta, semanalmente, os novos executivos e os principais anúncios de contratações, promoções e mudanças…

1 semana ago
All Rights ReservedView Non-AMP Version
  • L