Cientistas do Xerox Research Centre Europe, em França anunciaram recentemente o desenvolvimento de um software de classificação suficientemente inteligente para "ler" um documento electrónico, decidir como classificá-lo por tema e depois direcioná-lo para a caixa de correio electrónico da pessoa certa ou para o sistema de gestão de documentos online, tudo automaticamente.



Ainda sem nome definido, a tecnologia denominada pela Xerox como "ferramenta de categorização" está, segundo a fabricante, desde já disponível e pode ser licenciada por empresas que queiram adoptá-la para os seus sistemas de documentação, assim como por outras empresas de software.



Segundo Eric Gaussier, um dos investigadores do Xerox Research Centre Europe, as ferramentas de classificação actualmente disponíveis no mercado tratam as categorias temáticas independentemente de cada uma e são consideradas lineares. "Embora possa parecer óbvio aos humanos que a bioquímica e a biofísica sejam categorias de informação relacionadas, um sistema de classificação linear não estabeleceria uma ligação entre ambas", explica o cientista. "O sistema da Xerox usa um modelo hierárquico que consegue compreender a dependência entre estas duas categorias e por isso tomar uma decisão mais acertada quando classifica o documento", acrescenta.



De acordo com os resultados de um teste piloto à tecnologia no Swiss Institute of Bioinformatics, uma organização não lucrativa, os documentos certos foram encontrados mais vezes e mais rapidamente, face a outras ferramentas utilizadas. "Com poucos exemplos, o sistema aprende rapidamente por ele próprio a classificar documentos hierarquicamente nas categorias existentes", asseguram os responsáveis da Xerox em comunicado.



Escrito em Java, o novo software pode ser utilizado em várias plataformas, incluindo UNIX, Linux e Windows. A ferramenta de categorização da Xerox lida com documentos escritos em 20 línguas diferentes.


Notícias Relacionadas:

2003-09-20 - Xerox traça linhas de orientação para o próximo trimestre