A Amazon terá desenvolvido uma nova geração do seu modelo de inteligência artificial generativa, capaz de processar imagens e vídeo, para juntar à capacidade de processar texto que já tinha.
A informação está a ser avançada pelo site The Information, que cita duas fontes com conhecimento do tema. Sublinha que com este novo desenvolvimento a Amazon vai ficar menos dependente da tecnologia da Anthropic, dona do chatbot Claude, que é uma das tecnologias de referência na plataforma Amazon Web Services.
Recorde-se que a Amazon é um dos principais investidores da Anthropic, uma aposta que lhe tem valido uma relação privilegiada com a startup americana, e vantagens exclusivas para os clientes AWS que utilizam a tecnologia da Anthropic na plataforma.
No ano passado, anunciou um investimento de 4 mil milhões de dólares na startup e na semana passada comunicou outro investimento do mesmo valor. A cláusula melhor conhecida dos acordos, é que com eles a Amazon conseguiu passar a ser o parceiro de referência da Anthropic para o treino dos seus modelos de IA. Primeiro com os chips Trainium e agora também com os Inferentia, posicionando-se como uma alternativa à tecnologia da Nvidia para este fim.
A nova versão do LLM da Amazon tem o nome de código Olympus e terá capacidade para compreender imagens e vídeos, permitindo por isso a pesquisa de cenas ou imagens específicas. Um exemplo apontado na notícia, indica que o Olympus vai conseguir responder a um pedido em texto para encontrar imagens ou vídeos de um lançamento de basquete bem-sucedido.
Na próxima semana realiza-se a conferência anual AWS re:Invent. As fontes consultadas pelo The Information adiantam que o evento deverá ser o palco escolhido pela gigante do comércio eletrónico e dos serviços empresariais na cloud para apresentar o Olympus.
Vale a pena acrescentar que o LLM da Anthropic também já processa imagem e vídeo. O último anúncio da companhia na verdade já deu um passo à frente em relação a este tipo de evolução, que continua a ser aperfeiçoada à medida que as grandes plataformas fazem evoluir os seus LLMs para uma lógica de agentes. O Claude tem vindo a ser treinado para “trabalhar como um humano” e realizar sequências de ações para cumprir uma mesma tarefa.
Pergunta do Dia
Em destaque
-
Multimédia
Swift da NASA continua a descobrir fenómenos "explosivos", vinte anos depois do lançamento -
App do dia
Xpiry: Uma app que não deixa os alimentos passarem do prazo -
Site do dia
Konkr é um jogo browser inspirado em Risco e Civilization. Cuidado para não ficar viciado -
How to TEK
Saiba como fazer cálculos matemáticos escrevendo no bloco de notas da calculadora do iPadOS 18
Comentários