A Comissão Europeia quer potenciar uma das indústrias com maior crescimento na UE, a linguística, impulsionando as tecnologias da linguagem humana. O objectivo é apoiar o multilinguismo tornando a tradução assistida por computador "mais fácil, barata e acessível", explica Leonard Orban, Comissário para o Multilinguismo.



Para isso, a CE disponibilizou, gratuitamente, a sua colecção de cerca de um milhão de frases, e as suas traduções, em 22 das 23 línguas oficiais da UE, incluindo as dos novos Estados-membros.



Com esta iniciativa, os cidadãos "pertencem às comunidades linguísticas com menores dimensões" terão um acesso mais facilitado a "documentos e a páginas Web apenas disponíveis nas línguas mais utilizadas", frisa Janez Potocnik, Comissário para a Ciência e Investigação.



De acordo com a Comissão Europeia, este tipo de dados são frequentemente procurados por empresas focadas no desenvolvimento de ferramentas de tradução automática em que o software assimila, a partir de textos traduzidos manualmente, o modo como as palavras e frases são correcta e contextualmente traduzidas. Os mesmos textos podem ainda ser úteis na criação de sistemas de correcção ortográfica, gramaticais, dicionários em linha e sistemas multilingues de classificação de textos.



Janez Potocnik ressalva ainda o facto de esta colecção ser útil como veículo para "melhorar a competitividade da indústria linguística".



Neste sentido, os tradutores e os seus próprios cientistas da CE estão a disponibilizar grandes colecções de frases de documentos jurídicos que abrangem questões técnicas, políticas e sociais em 22 línguas, incluindo o letão e o romeno, dois idiomas ainda com poucas traduções.



As instituições tuteladas pela União Europeia são as que detêm o maior número de textos multilingues. Isto porque, legislação do executivo comunitário tem de ser publicada em cada uma das suas 23 línguas oficiais. Para isso, os serviços de tradução trabalham com 253 pares possíveis de combinações linguísticas e produzem cerca de 1,5 milhões de páginas traduzidas por ano.



A iniciativa é, de acordo com a CE "um bom exemplo da política aberta da Comissão de reutilizar os seus recursos de informação e segue-se à abertura das bases de dados terminológicas comunitárias Eur-Lex e IATE".



Notícias Relacionadas:

2006-08-25 - UE recomenda agilização dos processos para a criação da Biblioteca Digital Europeia