No final de setembro, a Meta revelou ao mundo a Make-A-Video, uma nova ferramenta que, através de Inteligência Artificial (IA), permite transformar texto em vídeo. Mas a empresa liderada por Mark Zuckerberg não é a única a fazer progresso nesta área liderada por tecnológicas como a OpenAI: a Google também tem a sua própria versão, chamada Imagen Video.
Como explicam os especialistas da gigante de Mountain View num novo artigo científico, a recém-revelada ferramenta baseia-se no Imagen, um sistema de IA da Google que é capaz de transformar texto em imagens.
Clique nas imagens para mais detalhes
De acordo com os investigadores, a Imagen Video começa gerar pequenos vídeos de 16 frames, com uma resolução de 24X48 pixels a partir de descrições textuais. A partir daí, a ferramenta aumenta a resolução da criação, prevendo frames adicionais. O resultado é um vídeo de 128 frames com uma resolução de 1280x768 pixels.
Ao todo, a Imagen Video foi treinada com um vasto número de datasets, incluindo 14 milhões de conjuntos de vídeos e textos, assim como 60 milhões de conjuntos de imagens e textos.
À semelhança do que sucede no caso da Make-A-Video da Meta, as criações da Imagen Video também têm algumas limitações, com os vídeos gerados a contarem, por vezes, com distorções ou formas e objetos com um aspecto que vai além do que seria considerado normal. No entanto, os investigadores esperam fazer melhorias à ferramenta de modo a colmatar estas limitações.
Uma vez que existem receios relativamente à utilização do sistema para gerar conteúdos violentos ou sexualmente explícitos, a Imagen Video e respetivo código-fonte não serão disponibilizados ao público até que estas questões sejam resolvidas.
Embora seja popular, a criação de vídeo e imagens através de IA também levanta novas questões e não está a “salvo” de polémicas. Recentemente, a Getty baniu o carregamento e a venda deste tipo de imagens, numa decisão sustentada principalmente por preocupações legais.
Pergunta do Dia
Em destaque
-
Multimédia
Entre o moderno e tradicional, as várias faces de Shenzen, o Silicon Valley da China -
App do dia
Identificação de plantas conta com a ajuda da PlantNet -
Site do dia
Sidenote é uma extensão para o Chrome que permite comentar ou falar ao vivo em qualquer página web -
How to TEK
Capte fotografias com maior qualidade com estas 8 dicas simples
Comentários