![Parlamentos de países de língua portuguesa vão contribuir para treino de inteligência artificial](/assets/img/blank.png)
O parlamento de Cabo Verde vai ser o primeiro a disponibilizar uma base de dados de palavras e terminologias, aberta ao mundo digital, a partir de janeiro, no âmbito de um projeto em expansão para outros países lusófonos.
O projeto do Instituto Internacional da Língua Portuguesa (IILP) conta com parceria científica do Centro de Linguística da Universidade Nova de Lisboa e vai permitir, por exemplo, que modelos de aprendizagem de inteligência artificial - conceito usualmente ilustrado com aplicações como o ChatGPT - possam alimentar-se desta nova fonte de informação, disse, hoje, o presidente da instituição, João Neves.
Os parlamentos de Timor-Leste e São Tomé e Príncipe também já iniciaram contactos para desenvolver bases de dados semelhantes, referiu, durante a oficialização do protocolo entre o IILP e a Assembleia Nacional de Cabo Verde, nas instalações do parlamento, na capital, Praia.
Presente esteve também o presidente da Assembleia da República portuguesa, José Pedro Aguiar-Branco, que está a realizar uma visita oficial de três dias ao arquipélago, a quem o presidente do IILP apelou à dinamização da iniciativa.
Na atualidade, referiu João Neves, os dados e a informação são como “ouro branco” e é necessário um trabalho de produção de informação com valor em língua portuguesa, que, por agora, responde por cerca de 3% dos conteúdos no mundo digital.
Uma base de dados aberta a todas as aplicações e utilizadores que reúna a terminologia (palavras, termos e padrões) de determinada área, como a atividade parlamentar, contribui para que as ferramentas eletrónicas passem a pensar em português, em vez de terem de procurar respostas noutras línguas e traduzirem-nas.
No parlamento de Cabo Verde, todo o acervo legislativo está a ser carregado para um programa, que processa os diferentes tipos de texto e verifica a frequência e relevância das palavras (léxico), catalogando-as na base de dados – depois de validadas por equipas da própria assembleia.
Um total de 50 fichas de entrada na terminologia já estão validadas e o acervo digital será aberto ao público a partir das 100 fichas validadas, algo que João Neves prevê que possa acontecer até final de janeiro.
“Esta é uma ferramenta de potencial interesse para todos os parlamentos e seria bom que, um dia, cada um tivesse este instrumento e teríamos uma base de dados terminológica da CPLP”, referiu João Neves.
Aquele responsável indicou que “há terminologias usadas no parlamento cabo-verdiano que não há em Portugal”, sinal de diversidade e potencial na aplicação da estratégia de digitalização. Seja como for, o IILP é uma instituição da Comunidade dos Países de Língua Portuguesa (CPLP), com sede na Praia, e que “necessita de parcerias” que sustentem os novos projetos, assinalou.
Fundada em 1996, a CPLP integra atualmente nove países - Angola, Brasil, Cabo Verde, Guiné-Bissau, Guiné-Equatorial, Moçambique, Portugal, São Tomé e Príncipe e Timor-Leste.
Pergunta do Dia
Em destaque
-
Multimédia
Ecrãs transparentes e tecnologia de áudio 3D brilham em formatos cada vez maiores nos televisores da CES 2025 -
Site do dia
28 dez 2024 09:48 TimeMap oferece uma nova forma de olhar para a história do mundo -
App do dia
Lance os dados em Yahtzee With Buddies e participe em minijogos com amigos -
How to TEK
4 formas de captar imagem e vídeo do ecrã do computador Windows
Comentários