Para a Google o futuro é conversacional. As pessoas vão falar para as máquinas e elas vão corresponder, ou com conversa ou com ações. Mas pelo meio há uma tecnologia que medeia esta interação humano-máquina e a Google está a assumir esse papel.
A pesquisa de voz da Google é uma ferramenta conhecida dos utilizadores. Está disponível nos telefones Android, está também agora disponível no Chrome, mas o objetivo passa por tornar a tecnologia ubíqua, disponível para todos em qualquer circunstância ou equipamento.
Para isso a Google tem uma equipa com mais de cem investigadores que querem atingir um primeiro grande objetivo: fazer com que a pesquisa de voz seja compatível com as 300 línguas mais utilizadas em todo o mundo. Este foi o objetivo traçado por Pedro Moreno, investigador da Google nos EUA e membro da equipa de desenvolvimento da área de voice search.
Pedro Moreno veio a Portugal falar sobre como a Google quer criar inovação tecnológica na área e como tem trabalhado para o fazer. Fazer com que um telemóvel entenda tudo o que dizemos parece uma tarefa difícil de entender para a maioria das pessoas, mas na empresa de Mountain View tem-se trabalhado para transformar o problema maior em desafios mais pequenos.
O investigador revelou que se trabalha sobretudo em três áreas: modelo de linguagem, que calcula a probabilidade de determinados termos surgirem juntamente com outros; a área lexical, onde assimilam os fonemas das palavras para perceberem como são ditas; e o modelo acústico, que está relacionado com o próprio som das palavras.
Cada área tem as suas dificuldades. Tal como exemplificou Pedro Moreno, só para o inglês existem cinco variantes, isto sem ter em conta a acentuação que as pessoas dão às palavras.
Mas é através desta bagagem de experiência que os utilizadores portugueses vão beneficiar. O Brasil é um dos países prioritários para a Google no que diz respeito ao desenvolvimento das pesquisas por voz, e como falam português, são grandes as probabilidades de os portugueses terem acesso a tudo o que os brasileiros vão ter.
O investigador espanhol da Google revelou ao TeK que não será difícil aplicar ao nível nacional o que será feito no Brasil e o que o mesmo será tentado com o espanhol, afinando-se com o tempo a melhor utilização das ferramentas de acordo com cada mercado.
Uma equipa de esforços e vontades
Apesar de haver situações onde as pesquisas escritas vão continuar a fazer sentido – pesquisar uma informação num local de trabalho por exemplo -, mas onde a tecnologia também vai melhorar através do reconhecimento de gestos, atirou Pedro Moreno, a voz tem muito potencial para o que se avizinha. Controlo da casa, da televisão, dos equipamentos wearable e até do carro, são áreas onde a pesquisa falada vai crescer.
O investigador jogou à defesa quando confrontado com a possibilidade de a Google monetizar com publicidade as pesquisas de voz. Para já, disse Pedro Moreno, essa não é uma prioridade e não se pensa nisso. Um pouco há imagem do YouTube, onde só passado alguns anos se descobriu a forma ideal de gerar dinheiro através dos vídeos online.
O espanhol está convicto de que uma realidade como o filme Her – onde um assistente virtual mantém uma conversa natural com os humanos – estará próximo de acontecer, “talvez dentro de cinco anos”, atirou o investigador. Sobre o projeto da Google que vai permitir tradução de voz em tempo real, através de streaming, o representante da empresa disse que não é difícil de se concretizar, apesar de não estar a trabalhar no projeto e de não conhecer mais pormenores.
Dentro deste contexto, Pedro Moreno revelou no entanto que na sua equipa de investigação há um elemento que é surdo e que usa os Google Glass como motor de tradução – a voz é passada a texto e exibida no pequeno ecrã que se situa acima do olho.
Sobre a concorrência, Siri da Apple e Cortana da Microsoft, Pedro Moreno revelou não usar muito os serviços rivais, mas saudou o aparecimento de novos players no segmento porque isso obriga a Google a estar constantemente a reinventar-se.
Escrito ao abrigo do novo Acordo Ortográfico
Pergunta do Dia
Em destaque
-
Multimédia
Robot Clone leva humanização a novos níveis de realismo com braços e músculos artificiais -
App do dia
Pegada é uma espécie de Tinder versão “quatro patas” para juntar cachorros em matches perfeitos -
Site do dia
Noteey é um recurso online para explorar pensamentos e ideias de forma visual -
How to TEK
Converse diretamente com o Gemini a partir da pesquisa do Chrome e utilize o Google Lens no browser
Comentários