O dataset agora disponibilizado conta com 400 mil gravações e mais de 500 horas de comandos de voz, que resultaram do contributo de 20 mil pessoas nos últimos meses.
Está disponível gratuitamente para programadores e empresas ou outros interessados que queiram incluir suporte a comandos de voz nas suas aplicações, produtos e serviços.
“Há poucos serviços comerciais de reconhecimento de voz de qualidade disponíveis, dominados por um pequeno número de grandes empresas”, escreveu o vice-presidente de estratégia de tecnologia da Mozilla, Sean White. “Na Mozilla, estamos muito entusiasmados com o potencial do reconhecimento de voz. Acreditamos que esta tecnologia pode e irá gerar uma onda de produtos e serviços inovadores, e por isso deve estar disponível para todos”.
O objetivo da Mozilla com a disponibilização para domínio público do dataset é contribuir para que os futuros sistemas de voz - como o seu próprio DeepSpeech - possam compreender com fluidez uma ampla variedade de tipos de fala e sotaques. Refira-se que o DeepSpeech tem uma taxa de erro por palavra de aproximadamente 6,5%, um valor considerado muito positivo face aos 10% estabelecidos inicialmente pela empresa.
Em destaque
-
Multimédia
Football Manager 26 regressa depois de um ano "lesionado". É para ganhar o campeonato? -
Site do dia
Ondas de 20 metros registadas a partir do espaço funcionam como "mensageiras" de tempestades -
App do dia
Viva a história emocionante de Anne através da resolução de puzzles -
How to TEK
Foi adicionado a um grupo no WhatsApp por alguém que não conhece? Saiba como sair de “mansinho” e reportar
Comentários