A Google continua a investir na inteligência artificial generativa, apontando que as empresas que têm investido na tecnologia, 86% reportaram aumentos nas receitas, num crescimento de cerca de 6%. As novidades focam-se na capacidade de reprodução de vídeo e imagens com um elevado nível de realismo. Nesse sentido, a empresa apresentou dois novos modelos de IA generativa que passam a estar disponíveis na plataforma Vertex AI: O Veo e o Imagen 3.
O Veo, que está disponível em formato “preview” na Vertex AI, oferece às empresas a capacidade de gerar vídeos de alta qualidade com prompts de texto e imagem. A Google diz que o modelo é o primeiro hyperscaler a oferecer um modelo de imagem para vídeo, com o objetivo de ajudar as empresas a transformar os seus recursos criativos em visuais dinâmicos. O objetivo do modelo é ajudar no processo criativo e melhorar a eficiência na produção de vídeo.
Veja na galeria imagens de exemplos dos modelos Imagen 3 e Veo da Google:
Já o modelo Imagen 3, que estará disponível para todos os clientes do Vertex AI na próxima semana, procura oferecer as imagens mais realísticas e de maior qualidade possível geradas por IA. Mais uma vez, os utilizadores apenas precisam de introduzir prompts simples para gerar imagens com qualidade superior às anteriores versões do modelo, a nível de detalhe, iluminação e redução de artefactos nos resultados visuais.
Estas imagens podem ser usadas pelas empresas em campanhas de marketing, em anúncios e design de produtos. As produções são aceleradas, os custos reduzidos, oferecendo formas de acelerar a prototipagem de conteúdos.
O modelo Veo foi desenvolvido pela Google DeepMind, prometendo a criação de vídeos com um ambiente cinematográfico, mas com diferentes estilos visuais mediante as necessidades dos utilizadores. Destaca-se pela sua elevada compreensão da linguagem natural e semânticas visuais.
Veja no vídeo um exemplo de uma publicidade criada pelo modelo Veo da Google:
Nos exemplos mostrados, o modelo criou a partir de uma fotografia animações fotorealistas baseado nas instruções inseridas por texto. Todo o ambiente e estilo presente nas fotografias são traduzidos nos vídeos gerados. Já os modelos gerados apenas por texto refletem os detalhes introduzidos pelas prompts, com descrições elaboradas do pretendido.
Através do Imagen 3, os criativos podem também editar fotos rapidamente através de prompts. Podem editar partes da imagem, acrescentando elementos que não existiam, expandindo os horizontes dos cenários ou fazer um simples redimensionamento para o tamanho necessário. Outro exemplo dado, além dos comandos de texto a descrever uma mulher com um vestido floral, é possível indicar um estilo a partir de uma imagem.
A Google salienta que a sua tecnologia foi desenhada e desenvolvida para ser segura e com responsabilidade. Todas as imagens geradas pelos modelos têm uma marca de água invisível, que ajudam a diminuir as preocupações relativas à desinformação. Têm ainda filtros de segurança para ajudar a proteger contra a criação de conteúdos perigosos e mal-intencionados. Os modelos prometem ainda respeitar as preocupações relativas aos direitos de autor.
Pergunta do Dia
Em destaque
-
Multimédia
Como é viver no espaço? 5 curiosidades e desafios na rotina de um astronauta -
App do dia
O que é que lhe apetece perguntar hoje à Inteligência Artificial? -
Site do dia
Este website é um editor de IA que ajuda a colocar palavras atrás de imagens -
How to TEK
Faça um planeamento melhor para chegar ao destino em 5 dicas no Waze
Comentários