O parlamento de Cabo Verde vai ser o primeiro a disponibilizar uma base de dados de palavras e terminologias, aberta ao mundo digital, a partir de janeiro, no âmbito de um projeto em expansão para outros países lusófonos.

O projeto do Instituto Internacional da Língua Portuguesa (IILP) conta com parceria científica do Centro de Linguística da Universidade Nova de Lisboa e vai permitir, por exemplo, que modelos de aprendizagem de inteligência artificial - conceito usualmente ilustrado com aplicações como o ChatGPT - possam alimentar-se desta nova fonte de informação, disse, hoje, o presidente da instituição, João Neves.

Os parlamentos de Timor-Leste e São Tomé e Príncipe também já iniciaram contactos para desenvolver bases de dados semelhantes, referiu, durante a oficialização do protocolo entre o IILP e a Assembleia Nacional de Cabo Verde, nas instalações do parlamento, na capital, Praia.

Presente esteve também o presidente da Assembleia da República portuguesa, José Pedro Aguiar-Branco, que está a realizar uma visita oficial de três dias ao arquipélago, a quem o presidente do IILP apelou à dinamização da iniciativa.

Na atualidade, referiu João Neves, os dados e a informação são como “ouro branco” e é necessário um trabalho de produção de informação com valor em língua portuguesa, que, por agora, responde por cerca de 3% dos conteúdos no mundo digital.

Uma base de dados aberta a todas as aplicações e utilizadores que reúna a terminologia (palavras, termos e padrões) de determinada área, como a atividade parlamentar, contribui para que as ferramentas eletrónicas passem a pensar em português, em vez de terem de procurar respostas noutras línguas e traduzirem-nas.

No parlamento de Cabo Verde, todo o acervo legislativo está a ser carregado para um programa, que processa os diferentes tipos de texto e verifica a frequência e relevância das palavras (léxico), catalogando-as na base de dados – depois de validadas por equipas da própria assembleia.

Um total de 50 fichas de entrada na terminologia já estão validadas e o acervo digital será aberto ao público a partir das 100 fichas validadas, algo que João Neves prevê que possa acontecer até final de janeiro.

Esta é uma ferramenta de potencial interesse para todos os parlamentos e seria bom que, um dia, cada um tivesse este instrumento e teríamos uma base de dados terminológica da CPLP”, referiu João Neves.

Aquele responsável indicou que “há terminologias usadas no parlamento cabo-verdiano que não há em Portugal”, sinal de diversidade e potencial na aplicação da estratégia de digitalização. Seja como for, o IILP é uma instituição da Comunidade dos Países de Língua Portuguesa (CPLP), com sede na Praia, e que “necessita de parcerias” que sustentem os novos projetos, assinalou.

Fundada em 1996, a CPLP integra atualmente nove países - Angola, Brasil, Cabo Verde, Guiné-Bissau, Guiné-Equatorial, Moçambique, Portugal, São Tomé e Príncipe e Timor-Leste.