
Esta semana o lançamento do Gemini da Google veio trazer o potencial dos modelos multimodais, onde a informação de entrada pode ser um vídeo, imagens, código ou áudio, entendendo o contexto e produzindo a resposta aos prompts dos utilizadores.
A Google diz que é o modelo de IA generativa mais poderoso e vai estar disponível em três modelos: Ultra, Pro e Nano. As versões mais avançadas só vão estar disponíveis no próximo ano, mas já é possível tirar partido de algumas das funcionalidades. Por enquanto ainda em modo limitado, só em texto, e só em inglês.
O modelo Gemini Pro está integrado no chatbot Bard e pode ser acedido através da página web, em bard.google.com. Tem de ter acesso a uma conta Google e estar ligado, já que não é possível fazê-lo em modo anónimo.

No futuro o objetivo é que sejam integradas as capacidades multimodais também no Bard, com a ligação às diferentes aplicações da Google, como o Gmail ou o Youtube, entre outras. Este é um dos principais elementos de diferenciação face a outros modelos, como o ChatGPT ou o GPT 4 da OpenAI, ou o Copilot e Bing da Microsoft.
A Google promete adicionar o Gemini ao Bard noutras línguas em breve, mas sem adiantar datas. A versão mais poderosa do Gemini, o Ultra, deve ficar disponível em 2024 e tudo indique que poderá ser usada numa versão "optimizada" do Bard, o Bard Advanced.
Veja o vídeo de apresentação do Gemini da Google
Pergunta do Dia
Em destaque
-
Multimédia
Xiaomi "ataca" Porsche e automóveis de alta cilindrada com o elétrico SU7 Ultra abaixo dos 70 mil euros -
App do dia
Mister Antonio: Salte entre planetas e resolva desafios para agradar a um gato muito exigente -
Site do dia
Tem uma montanha de tarefas pela frente? Esta extensão ajuda a manter tudo organizado a partir do browser -
How to TEK
Aumente a privacidade e “tape os ouvidos” ao seu smartphone
Comentários