A Intel lançou um software de reconhecimento da fala por leitura dos lábios nos termos de uma licença open-source. Denominado Audio Visual Speech Recognition (AVSR), o programa integra-se na biblioteca de código de reconhecimento facial e de visão computorizada da companhia, permitindo acompanhar os movimentos da boca do orador à medida que são formados caracteres individuais e sons de sílabas.



Segundo a fabricante de semicondutores, esta técnica é bastante mais precisa e rigorosa do que os algoritmos tradicionais de reconhecimento da voz, que analisam os sons em vez das imagens. Contudo, o sistema funciona melhor quando combinado com o reconhecimento facial para identificar os oradores em questão, obtendo-se os melhores resultados com uma mistura de algoritmos de reconhecimento de áudio e vídeo, em que um concede mais importância às escolhas feitas pelo outro, especialmente à medida que o ruído de fundo aumenta.



O código foi desenvolvido pela subsidiária Intel Research da fabricante, que tem como parte da sua tarefa conceber aplicações que tirem o máximo partido do poder de processamento dos actuais processadores de PCs comuns. Mas a Intel está também a criar uma aplicação que utiliza câmaras para monitorizar pacientes de hospitais de forma a detectar risco de ataques e software que recorre a uma câmara de segurança para detectar potenciais criminosos num parque de estacionamento. Em ambos os programas o princípio é o mesmo: o computador envia um alerta quando detecta algo inusual na sua emissão de vídeo.



O trabalho requerido por estas aplicações e o desenvolvimento do AVSR está a decorrer no centro de investigação da Intel na China, em Beijing. Paralelamente com este anúncio, a companhia divulgou uma versão de testes de uma biblioteca técnica para a criação de redes bayesianas. Uma versão final desta biblioteca, denominada Probability Network Library, deverá ser lançada até ao final do ano.


Notícias Relacionadas:

2003-02-22 - Intel divulga futuros lançamentos de processadores para desktops

2002-09-18 - IBM lança software tradutor multilingue ViaVoice Translator para PDAs

2000-06-15 - Falar com o computador

Não perca as principais novidades do mundo da tecnologia!

Subscreva a newsletter do SAPO Tek.

As novidades de todos os gadgets, jogos e aplicações!

Ative as notificações do SAPO Tek.

Newton, se pudesse, seguiria.

Siga o SAPO Tek nas redes sociais. Use a #SAPOtek nas suas publicações.