Nvidia põe inteligência artificial a restaurar fotos "estragadas"

24 abr 2018 12:33

Este artigo tem mais de 7 anos

A fabricante de placas gráficas está a investir numa plataforma de rede neural para ajudar a editar e a reconstruir fotografias.

Com a tecnologia de inteligência artificial que a Nvidia está a desenvolver, as fotografias com tratamento “Photoshop” vão ser levadas a um próximo nível. Um grupo de investigadores da empresa está a treinar uma rede neural através de uma framework de deep learning, aplicando máscaras geradas a imagens disponíveis em diferentes bases de dados, tais como a ImageNet, Places 2 e CelebA-HQ.

O objetivo da tecnologia é editar fotografias ou reconstruir imagens. É mesmo possível apagar elementos da foto e preencher os respetivos "buracos" criados com camadas realísticas.

Como é possível ver no vídeo, para treinar o sistema foram criados buracos ou apagadas áreas em imagens completas, disponíveis nas bases de dados. Ao todo, foram geradas mais de 55 mil máscaras aleatórias e "buracos" com diferentes formas e tamanhos. O objetivo foi ensinar a rede neural a reconstruir os pixéis em falta nas fotografias. Para testar a rede neural, foram introduzidas depois novas falhas nas imagens, diferentes das que haviam sido submetidas anteriormente, e tentar validar o grau de precisão na reconstrução.

Os investigadores explicaram que as soluções atuais de deep learning no tratamento de imagens contêm falhas porque os pixéis desaparecidos, que necessitam ser corrigidos, dependem da quantidade de pixéis que têm de ser introduzidos na rede neural. Isto cria discrepâncias nas cores e imagens desfocadas. O método da Nvidia anula essa dependência de pixéis introduzidos, utilizando uma camada de convolução parcial, capaz de normalizar os valores dos pixéis em falta.

No vídeo mostra-se que a tecnologia consegue rapidamente alterar paisagens ou reconstruir a cara das pessoas, com um simples passar do rato. Segundo a Nvidia, este método que apelidou de “Image inpainting” pode ser implementado em qualquer software de edição de fotografias, sem qualquer limitação de formas ou tamanho da área que necessita ser editada.

Para ajudar a processar a rede neural de deep learning, a Nvidia está a utilizar o seu centro de dados baseado em GPUs Tesla V100 e a infraestrutura PyTorch.