A voz será a próxima interface de utilizador

Por Alex Huggins (*)

Não surpreende ouvir dizer que o mercado das aplicações móveis está a desenvolver-se de forma exponencial. De acordo com um relatório recente do IDC, as aplicações móveis atingiram cerca de 10 mil milhões em 2010 e terão uma taxa de crescimento anual composta de 60 por cento em 2011. Num mercado sobrelotado, os programadores procuram diferenciar a sua oferta das outras aplicações disponíveis - e uma das formas de o fazer é através da incorporação da voz.

Enquanto os ecrãs tácteis eram vistos outrora como uma revolução nas interfaces móveis, a fala é um novo método de entrada que está a ser explorado tanto pelos criadores como pelos fabricantes de equipamentos mãos-livres. Tão importantes como os desenvolvimentos no mercado de aplicações são os progressos na tecnologia de reconhecimento de voz.

O reconhecimento de voz não é novidade e é ainda considerado por muitos como rudimentar e pouco preciso. Este cepticismo é compreensível, mas a tecnologia melhorou de tal forma nos últimos anos que agora está a ser utilizada em sistemas a bordo de veículos, para seleccionar música, actualizar perfis em redes sociais em movimento e interagir com equipamentos de navegação, assim como em call centers em todo o mundo, ajudando as empresas a gerir as chamadas recebidas de forma mais eficiente e a oferecer melhores serviços ao cliente. Não falta muito para falarmos com a nossa televisão para lhe pedirmos que mude o canal.

A combinação do potencial da tecnologia de reconhecimento de voz com um mercado em crescimento de criação de aplicações oferece oportunidades para cativar os clientes e gerar novas receitas por meios que antes não existiam.

[caption]Nome da imagem[/caption]

No início do ano, a Nuance, empresa sediada nos Estados Unidos e que está por trás da Dragon Dictation e de aplicações de pesquisa do iPhone, lançou o seu programa de criação móvel, o NDEV - oferecendo aos criadores de aplicações a oportunidade de integrar uma plataforma de voz na sua oferta. Para além do reconhecimento de voz, o kit de criação de software (SDK), dá acesso a uma ferramenta de síntese de voz, gerando áudio de som natural a partir de uma entrada de texto. Isto significa não só que os utilizadores podem falar para o seu telemóvel e ser compreendidos, mas também que o equipamento é capaz de responder. Nesta sociedade cada vez mais sem tempo e de mãos ocupadas todos os esforços das empresas no sentido de facilitar a vida aos seus consumidores e trabalhadores é sem dúvida bem-vinda.

Grandes marcas como a Amazon já estão a utilizar o poder da voz para trabalhar com os seus clientes - destacando a sua oferta da concorrência. Lançou recentemente a sua aplicação de verificação de preços que permite aos utilizadores pronunciarem simplesmente o nome de um produto enquanto fazem compras para receberem imediatamente os preços desse artigo no Amazon.com. A funcionalidade adicional da aplicação permite aos utilizadores digitalizar um código de barras, captar uma imagem ou digitar o nome de um produto para receber resultados relacionados com o produto e preços da Amazon.com e dos seus outros fornecedores online.

A utilização da tecnologia de pesquisa de voz, sobretudo para aplicações móveis de comércio electrónico, demonstra de que forma a voz pode trazer força e eficácia à experiência de fazer compras numa plataforma móvel. Permite aos criadores como a Amazon oferecer aos consumidores uma forma inovadora e intuitiva de encontrar informação sobre os seus produtos e serviços favoritos - a qualquer hora, em qualquer lugar.

Entretanto, a empresa Merriam-Webster, de dicionários e thesaurus online, utilizou a tecnologia de voz para preencher uma lacuna no mercado. Percebeu que quando se procura a ortografia de uma palavra no dicionário é muito mais eficaz pronunciar a palavra que se procura do que tentar escrevê-la. A pesquisa de voz dá resposta a esta necessidade.

O programa NDEV teve tanto êxito que a Nuance o concebeu de forma a oferecer três patamares de serviços - Silver, Gold e Emerald. Assim oferece-se aos criadores mais flexibilidade quanto à forma de colocar as suas inovações no mercado - desde um serviço básico gratuito Silver, a um serviço Emerald que oferece toda uma panóplia de opções de personalização e serviço, desde empresas em fase de arranque a operadoras sem fios, OEM e grandes empresas, assim como léxicos e gramáticas personalizados.

Embora a tecnologia de reconhecimento de voz envolver alguma controvérsia, a realidade é que atingiu um nível de desenvolvimento tal que oferece agora uma proposta válida às empresa e consumidores. Estamos num momento empolgante agora que começamos a ver a interface de voz tornar-se a interface móvel para muitos clientes.

Actualmente, é possível encontrar e ouvir rapidamente música, aceder a filmes em streaming, encontrar revendedores locais, obter relatórios, fazer reservas e mais. Com mais de 4 000 criadores a desenvolverem aplicações únicas utilizando tecnologia de voz através da plataforma NDEV, é possível proporcionar experiências melhores aos clientes em todo o mundo. A boa notícia é que estamos apenas no início.

(*) EMEA Sales Engineering Manager da Nuance