Os investigadores da Microsoft desenvolveram um novo sistema baseado em inteligência artificial que promete ser mais eficaz a descrever imagens do que os humanos. O sistema foi usado para atualizar a Seeing AI, a aplicação criada pela gigante tecnológica para ajudar pessoas com dificuldades ou deficiências visuais a "ler" o mundo a seu redor.
A Microsoft explica que o sistema de IA permite melhorar significativamente o desempenho da aplicação. Além de ser capaz de identificar objetos, a tecnologia consegue descrever a relação entre eles de uma forma mais precisa.
De acordo com Lijuan Wang, um dos principais investigadores do laboratório de pesquisa da empresa, a legendagem de imagens é um dos desafios centrais do mundo da visão computacional, pois a IA precisa de perceber e descrever os conteúdos ou ações principais que estão a ser apresentados.
Assim, a IA passou por um processo de “pré-treino” com um dataset repleto de imagens que continham etiquetas apenas com palavras associadas aos objetos apresentados em vez de frases completas.
Depois de ter ganho um vocabulário visual, a IA foi treinada novamente para aprender a construir frases com a informação que lhe tinha sido disponibilizada. Ao ser avaliada no nocaps, uma ferramenta de benchmark para sistemas de legendagem de imagens, a criação da Microsoft conseguiu alcançar uma pontuação alta, saltando para o topo da tabela.
A empresa vai disponibilizar também o novo sistema de IA como parte dos serviços cognitivos do Azure, para que qualquer developer os possa incluir nos seus projetos. Em breve, a tecnologia vai ser incorporada em produtos da Microsoft, como a suite de produtividade do Office, para ajudar os utilizadores a criar texto alternativo para as imagens.
Pergunta do Dia
Em destaque
-
Multimédia
20 anos de Halo 2 trazem mapas clássicos e a mítica Demo E3 de volta -
App do dia
Proteja a galáxia dos invasores com o Space shooter: Galaxy attack -
Site do dia
Google Earth reforça ferramenta Timelapse com imagens que remontam à Segunda Guerra Mundial -
How to TEK
Pesquisa no Google Fotos vai ficar mais fácil. É só usar linguagem “normal”
Comentários