Com a tecnologia de inteligência artificial que a Nvidia está a desenvolver, as fotografias com tratamento “Photoshop” vão ser levadas a um próximo nível. Um grupo de investigadores da empresa está a treinar uma rede neural através de uma framework de deep learning, aplicando máscaras geradas a imagens disponíveis em diferentes bases de dados, tais como a ImageNet, Places 2 e CelebA-HQ.
O objetivo da tecnologia é editar fotografias ou reconstruir imagens. É mesmo possível apagar elementos da foto e preencher os respetivos "buracos" criados com camadas realísticas.
Como é possível ver no vídeo, para treinar o sistema foram criados buracos ou apagadas áreas em imagens completas, disponíveis nas bases de dados. Ao todo, foram geradas mais de 55 mil máscaras aleatórias e "buracos" com diferentes formas e tamanhos. O objetivo foi ensinar a rede neural a reconstruir os pixéis em falta nas fotografias. Para testar a rede neural, foram introduzidas depois novas falhas nas imagens, diferentes das que haviam sido submetidas anteriormente, e tentar validar o grau de precisão na reconstrução.
Os investigadores explicaram que as soluções atuais de deep learning no tratamento de imagens contêm falhas porque os pixéis desaparecidos, que necessitam ser corrigidos, dependem da quantidade de pixéis que têm de ser introduzidos na rede neural. Isto cria discrepâncias nas cores e imagens desfocadas. O método da Nvidia anula essa dependência de pixéis introduzidos, utilizando uma camada de convolução parcial, capaz de normalizar os valores dos pixéis em falta.
No vídeo mostra-se que a tecnologia consegue rapidamente alterar paisagens ou reconstruir a cara das pessoas, com um simples passar do rato. Segundo a Nvidia, este método que apelidou de “Image inpainting” pode ser implementado em qualquer software de edição de fotografias, sem qualquer limitação de formas ou tamanho da área que necessita ser editada.
Para ajudar a processar a rede neural de deep learning, a Nvidia está a utilizar o seu centro de dados baseado em GPUs Tesla V100 e a infraestrutura PyTorch.
Em destaque
-
Multimédia
Frigoríficos com anúncios, chupa-chupas eletrónicos e campainhas invasivas nos piores gadgets da CES 2026 -
App do dia
Superfluent ajuda quem já domina o "bê-a-bá" a falar uma nova língua com mais confiança -
Site do dia
Airloom: Acompanhe voos em tempo real numa experiência 3D imersiva -
How to TEK
Quais são as novidades do Google Maps para ajudar a chegar ao seu destino? Veja estas dicas de personalização
Comentários