A Intel lançou um software de reconhecimento da fala por leitura dos lábios nos termos de uma licença open-source. Denominado Audio Visual Speech Recognition (AVSR), o programa integra-se na biblioteca de código de reconhecimento facial e de visão computorizada da companhia, permitindo acompanhar os movimentos da boca do orador à medida que são formados caracteres individuais e sons de sílabas.
Segundo a fabricante de semicondutores, esta técnica é bastante mais precisa e rigorosa do que os algoritmos tradicionais de reconhecimento da voz, que analisam os sons em vez das imagens. Contudo, o sistema funciona melhor quando combinado com o reconhecimento facial para identificar os oradores em questão, obtendo-se os melhores resultados com uma mistura de algoritmos de reconhecimento de áudio e vídeo, em que um concede mais importância às escolhas feitas pelo outro, especialmente à medida que o ruído de fundo aumenta.
O código foi desenvolvido pela subsidiária Intel Research da fabricante, que tem como parte da sua tarefa conceber aplicações que tirem o máximo partido do poder de processamento dos actuais processadores de PCs comuns. Mas a Intel está também a criar uma aplicação que utiliza câmaras para monitorizar pacientes de hospitais de forma a detectar risco de ataques e software que recorre a uma câmara de segurança para detectar potenciais criminosos num parque de estacionamento. Em ambos os programas o princípio é o mesmo: o computador envia um alerta quando detecta algo inusual na sua emissão de vídeo.
O trabalho requerido por estas aplicações e o desenvolvimento do AVSR está a decorrer no centro de investigação da Intel na China, em Beijing. Paralelamente com este anúncio, a companhia divulgou uma versão de testes de uma biblioteca técnica para a criação de redes bayesianas. Uma versão final desta biblioteca, denominada Probability Network Library, deverá ser lançada até ao final do ano.
Notícias Relacionadas:
2003-02-22 - Intel divulga futuros lançamentos de processadores para desktops
2002-09-18 - IBM lança software tradutor multilingue ViaVoice Translator para PDAs
2000-06-15 - Falar com o computador
Pergunta do Dia
Em destaque
-
Montra TeK
7 smartphones modernos e apelativos abaixo dos 250 euros -
Site do dia
Projeto oVert oferece uma visão única de mais de 13 mil animais vertebrados -
App do dia
Adepto dos “livros áudio”? Esta app gratuita pode ser uma hipótese a considerar -
How to TEK
Saiba como ativar os filtros contra resultados explícitos e não seguros no Google Search
Comentários