A língua continua a ser base do “negócio” da Priberam, que nos últimos transformou o modelo e linha de desenvolvimento de produtos e serviços, acompanhando e antecipando algumas tendências da transformação do mercado. Criada em 1989 a empresa de software ainda é reconhecida pelo dicionário online e pelas ferramentas linguísticas FLiP, mas Carlos Amaral, fundador e CEO da Priberam, explica que agora todo o negócio é B2B.

“Manteve-se uma linha condutora, com o processamento computacional da língua”, explica, lembrando que o próprio FLiP já integrava esta tecnologia na análise da correção do texto, e esta linha de desenvolvimento evoluiu também para motores de pesquisa semântica. Mas não ficou por aí. “Nos últimos anos houve uma mudança grande do mercado e felizmente conseguimos antecipar”, adiantou o CEO da Priberam, explicando que o Machine Learning e a possibilidade de dar algumas tarefas ao computador, em vez de as programar, e fazer evoluir as tarefas com a capacidade do computador aprender foi aplicado especificamente à língua, surgindo daqui uma série de projetos de inovação.

A criação da Priberam Labs, para fazer investigação nessa área, foi um primeiro passo, permitindo a incorporação do desenvolvimento nos vários produtos da empresa e a participação em diversos projetos nacionais e europeus de investigação, mas mantendo a cooperação com universidades, institutos e empresas, nacionais e estrangeiras.

“Focámo-nos no processamento de texto para extrair informação, o que tem muita aplicação em várias áreas. Isto inclui informação escrita, falada e em vídeo, produzida por humanos. Ainda não estamos a pensar nos IoT”, explica Carlos Amaral, dando como exemplos a área da saúde onde 80% dos dados sobre os pacientes estão escritos, ou as notícias, leis, patentes e mesmo as publicações nas redes sociais.

Áreas em desenvolvimento

Atualmente a Priberam está focada em três áreas: os media, com vários projetos; monitorização de media e monitorização tecnológica. E é nestes três vetores que tem desenvolvido uma série de projetos, entre os quais se destaca o Summa, uma plataforma desenvolvida no âmbito do programa Horizonte 2020.

O projeto terminou no início deste ano, depois de 3 anos de desenvolvimento, e contou com 8 parceiros no desenvolvimento de uma plataforma de monitorização de media a aplicar na BBC e na Deutsche Welle  para apoio ao processo de investigação jornalística e monitorização de várias fontes de informação em diferentes línguas.

O SUMMA (Scalable Understanding of Multilingual MediA) consegue agregar e filtrar os conteúdos, criando bases de conhecimento e uma apresentação gráfica que ajuda a gerir um grande volume de informação. Por dentro estão tecnologias de reconhecimento de voz e texto, machine translation e identificação de histórias, relação de entidades e compreensão de linguagem natural, incluindo o sentimento.

“Estamos a explorar a forma de usar a plataforma noutras áreas, fora dos media, e já testámos com a Embraer que precisava de monitorizar um grande volume de fontes de informação para acompanhar as tendências do mercado”, sublinha Carlos Amaral.

Na área da Saúde há também um projeto em desenvolvimento com o Hospital de São João, no Porto, e a Faculdade de Medicina, para gerir os dados e criar valor imediato, automatizando o processo de apresentação da informação relevante da história clínica dos pacientes. “O que estamos a conseguir é pegar numa série de informação e apresentá-la ao médico de uma forma imediata, para que ele a possa consumir, e depois pode ler o relatório clínico”, explica, afirmando que não se está a pensar na área de previsão nem de processos de decisão.

Robot jornalista e outros projetos

Ainda na área de media a Priberam tem uma série de projetos desenvolvidos no âmbito do Google News Innitiative, alguns dos quais em Portugal, como o robot jornalista desenvolvido para a aplicação do Público, e que vai produzir textos a partir de bases de dados de jogos de modalidades como o Hóquei em Patins, Voleibol, Basquetebol e mesmo Futebol Feminino, sem intervenção de humanos. Para a Cofina a empresa está a trabalhar num interface para fala com smart speakers, permitindo interação com os títulos e sumarização das notícias.

Apesar das mudanças a empresa continua a manter o Dicionário online, que assinala em 2019 os 10 anos e é um dos sites mais consultados em Portugal, mas que já é globalmente relevante, com um total de 132 milhões de consultas em 2018, feitas por 37 milhões de pessoas. O dicionário está integrado como auxiliar de leitura nos leitores de livro eletrónicos Kindle e Kobo, e Carlos Amaral lembra que tem também um papel transversal às áreas mais avançadas, como a análise semântica e a inteligência artificial aplicada à língua.

A área de Media, onde a empresa tem mais histórico, a monitorização de media e tecnologia, e a área da saúde digital, junto com o legal research, consolidam agora as apostas da Priberam e o caminho de futuro da empresa, e Carlos Amaral adianta que há muitos “leads” a explorar nesta área, onde o potencial é muito grande. “São apostas que em termos estratégicos fazem todo o sentido, e mesmo na área da geração automática de texto temos um interesse brutal, aqui e no Brasil”, afirma.

Nota da Redação: Foram feitas duas correções no artigo. Corrigido às 9h25 de 20/8/2019

Não perca as principais novidades do mundo da tecnologia!

Subscreva a newsletter do SAPO Tek.

As novidades de todos os gadgets, jogos e aplicações!

Ative as notificações do SAPO Tek.

Newton, se pudesse, seguiria.

Siga o SAPO Tek nas redes sociais. Use a #SAPOtek nas suas publicações.