Inteligência artificial da Amazon ganha capacidade de processar video

28 nov 2024 10:46

Este artigo tem mais de um ano

A novidade pode ser apresentada oficialmente na próxima semana, durante um evento da Amazon. A nova versão do LLM da empresa com capacidade para processar imagens e vídeo terá o nome de código Olympus. O que pode mudar para a Amazon com este avanço?

A Amazon terá desenvolvido uma nova geração do seu modelo de inteligência artificial generativa, capaz de processar imagens e vídeo, para juntar à capacidade de processar texto que já tinha.

A informação está a ser avançada pelo site The Information, que cita duas fontes com conhecimento do tema. Sublinha que com este novo desenvolvimento a Amazon vai ficar menos dependente da tecnologia da Anthropic, dona do chatbot Claude, que é uma das tecnologias de referência na plataforma Amazon Web Services.

Recorde-se que a Amazon é um dos principais investidores da Anthropic, uma aposta que lhe tem valido uma relação privilegiada com a startup americana, e vantagens exclusivas para os clientes AWS que utilizam a tecnologia da Anthropic na plataforma.

No ano passado, anunciou um investimento de 4 mil milhões de dólares na startup e na semana passada comunicou outro investimento do mesmo valor. A cláusula melhor conhecida dos acordos, é que com eles a Amazon conseguiu passar a ser o parceiro de referência da Anthropic para o treino dos seus modelos de IA. Primeiro com os chips Trainium e agora também com os Inferentia, posicionando-se como uma alternativa à tecnologia da Nvidia para este fim.

A nova versão do LLM da Amazon tem o nome de código Olympus e terá capacidade para compreender imagens e vídeos, permitindo por isso a pesquisa de cenas ou imagens específicas. Um exemplo apontado na notícia, indica que o Olympus vai conseguir responder a um pedido em texto para encontrar imagens ou vídeos de um lançamento de basquete bem-sucedido.

Na próxima semana realiza-se a conferência anual AWS re:Invent. As fontes consultadas pelo The Information adiantam que o evento deverá ser o palco escolhido pela gigante do comércio eletrónico e dos serviços empresariais na cloud para apresentar o Olympus.

Vale a pena acrescentar que o LLM da Anthropic também já processa imagem e vídeo. O último anúncio da companhia na verdade já deu um passo à frente em relação a este tipo de evolução, que continua a ser aperfeiçoada à medida que as grandes plataformas fazem evoluir os seus LLMs para uma lógica de agentes. O Claude tem vindo a ser treinado para “trabalhar como um humano” e realizar sequências de ações para cumprir uma mesma tarefa.