quinta-feira, 24 de dezembro de 2009

Reconhecimento de voz: não tão bom quanto poderia ser; nem tão ruim que você não possa usar.


Programas de reconhecimento de voz não são tão recentes quanto você possa imaginar. As primeiras pesquisas e aplicações datam do final da década de 80. O surgimento e aprimoramento dos microcomputadores aprimorou o recurso, que passou a ser mais utilizado.

Seu uso por nós, usuários domésticos, vem crescendo, apesar de que ainda poucos aqueles com paciência de lidar com esse tipo de programa. A questão é que, para funcionar razoavelmente bem, o programa precisa ser treinado e "se acostumar" com sua voz. Isso pode exigir várias horas de leitura de textos e análise de seus documentos, já que os dicionários não são completos e há muita dificuldade no reconhecimento de nomes próprios e termos técnicos.

O melhor programa de reconhecimento de voz hoje existente é o Dragon Naturally Speaking, da empresa Nuance. Mas não se anime, ele ainda não suporta o português nem é gratuito. Recentemente, a empresa entrou no mercado dos smartphones, quando lançou uma versão gratuita de seu sistema para o iPhone. Como imagens valem mais que mil palavras, vejam estes vídeos incríveis que mostram o quão rápido e preciso ele é:





Na avaliação que fiz com a versão de testes do produto, em inglês, não consegui resultados tão espantosos como os dos vídeos acima, porém, devo ressaltar, minha pronúncia não é das melhores e sequer treinei o suficiente.

Para nós que falamos o português, a melhor opção continua sendo o IBM ViaVoice 9, lançado há muito tempo atrás. Ele funciona apenas no Windows XP e, com muito treino, apresenta um índice de acerto razoável, dependendo da velocidade que você dita: quanto mais devagar, mais preciso ele é. Como o produto já foi descontinuado pela IBM, que tornou aberto o código de seus programas de reconhecimento de voz, só o achamos em redes de compartilhamento de arquivos.

Ele não é completo como o Dragon, porém, como dito, dá conta do recado se bem treinado. Com um bom microfone, ambiente silencioso e pronúncia clara e pausada, consegui que o programa reconhecesse parágrafos inteiros sem erros. O problema é que muita gente gosta de falar no seu ritmo normal, o que torna menor o desempenho do software. Imaginem como seria péssimo o resultado com o finado político Enéas Carneiro.

O fato é que a tecnologia está amadurecida. Necessita sim de aprimoramentos, os quais tornariam o uso de reconhecimento de voz costumeiro em nossas vidas, facilitando bastante a vida dos deficientes visuais ou daqueles que sofrem com problemas motores, já que, além de reconhecer a voz, estes programas lêem o que foi ditado. Por enquanto, talvez seja melhor usá-los apenas para textos longos ou de fácil compreensão fonética.

Ah!, já ia esquecendo. A Microsoft tem no Windows Vista e no Windows 7 um programa próprio de reconhecimento de voz. Pena que, mesmo em inglês, precisa de muito trabalho ainda...


Nenhum comentário:

Postar um comentário