Um grupo de programadores da Universidade de Carnegie Mellon lançou ReCaptcha, um serviço que promete ajudar no combate ao spam enquanto permite que os utilizadores apoiem a digitalização de livros, escreve a Associated Press.




Embora à primeira vista as duas vantagens do projecto pareçam não ter um elo de ligação, Luis von Ahn, professor da universidade norte-americana, explica o processo salientando que o novo serviço é apoiado no processo Captcha, uma técnica utilizada em diversas páginas online onde se pede ao utilizador para decifrar e digitar uma sequência de caracteres distorcidos antes de ser submetida determinada informação no site.




Von Ahn explica que a digitalização de livros é um processo complicado na medida em que nem sempre os scans das páginas das obras ficam claras. A distorção de algumas palavras na imagem final acaba por ser um obstáculo para a tradução efectuada pelos programas utilizados o que acaba por comprometer a digitalização da obra.




Neste sentido, ao utilizar a técnica Captcha, acaba por se juntar "o útil ao agradável" já que professor universitário pretende "melhorar o processo de transformação de imagens em texto" através da referida tecnologia.




Luis von Ahn refere que "são enviadas imagens das palavras dos livros sob a forma Captcha para que as pessoas na Internet as decifrem. Ao resolver uma das sequências o utilizador estará também a ajudar na digitalização de um livro".




Este projecto, que inclui a correcção de todas as palavras por decifrar existentes em todos os tipos de obras, sejam históricas, de ficção, técnicas, entre outras, tem o apoio do site archive.org, que detém uma base de mais de cem mil títulos. Todas as obras decifradas vão estar disponíveis no referido site e de forma gratuita, assegura o responsável.




Desde o seu lançamento, na passada terça-feira, já foram decifradas mais de oito mil palavras estando o serviço disponível, actualmente, em mais de 150 páginas online.




Os criadores do projecto afirmam que todos os dias são resolvidos mais de 60 milhões de sequências Captcha. A técnica é utilizada há mais de cinco anos e tem como propósito decifrar se os acessos aos websites são feitos por pessoas ou por máquinas - Captcha (Completely Automated Public Turng test to tell Computers and Humans Apart).




Notícias Relacionadas:

2002-12-31 - Yahoo! e Hotmail utilizam nova arma de combate ao spam