Em maio, durante a edição de 2023 do Google I/O, a Google tinha dado a conhecer que estava a trabalhar no desenvolvimento do seu próximo modelo de inteligência artificial. Agora, a gigante de Mountain View apresenta o Gemini, descrito pela empresa como o seu maior e mais capaz modelo de IA. 

A Google explica que o novo modelo é multimodal, o que significa que pode compreender, operar e combinar diferentes tipos de informação, incluindo texto, imagens, áudio, vídeo e código. A primeira versão do modelo, Gemini 1.0, foi optimizada para três "tamanhos" diferentes: Nano, Pro e Ultra.

A versão Nano foi concebida para trazer mais eficiência às tarefas nos dispositivos. Já o Gemini Pro é descrito pela Google como o melhor modelo para escalar um conjunto alargado de tarefas. A versão Ultra do modelo é a maior traz ainda mais capacidades para dar conta de tarefas com elevado nível de complexidade.

De acordo com a tecnológica, o modelo foi submetido a testes rigorosos para avaliar o seu desempenho numa variedade de tarefas.  No caso do Gemini Ultra, o seu desempenho é superior aos resultados atuais de 30 dos 32 benchmarks utilizados na investigação e desenvolvimento de modelos de linguagem de grande escala (LLMs, na sigla em inglês).

O Gemini Ultra conseguiu alcançar uma pontuação de 90,0%, superando especialistas humanos em MMLU (Compreensão Massiva de Linguagem Multitarefa, em português), que usa combina 57 disciplinas, como matemática, física, história, direito, medicina e ética, para testar o conhecimento do mundo e a capacidade de resolução de problemas.

Veja o vídeo 

O Gemini 1.0 será disponibilizado numa variedade de produtos e plataformas. Por exemplo, a empresa afirma que, a partir de hoje, o Bard vai usar uma versão otimizada do Gemini Pro. Esta atualização, que segundo a Google é a maior desde o lançamento do chatbot, estará disponível em inglês em mais de 170 países e territórios. A empresa planeia expandir para diferentes modalidades e oferecer suporte a novos locais e idiomas num futuro próximo.

A Google vai trazer também o modelo para os smartphones Pixel. O Pixel 8 Pro, lançado em outubro deste ano, é o primeiro smartphone da empresa preparado para executar o Gemini Nano, que alimentará novas funcionalidades, incluindo respostas inteligentes no Gboard, que vão começar por chegar ao WhatsApp e, depois, a mais apps de mensagens no próximo ano.

A Google avança que, nos próximos meses, o Gemini estará disponível em produtos como Pesquisa, Anúncios, Chrome e Duet AI. A tecnológica já está a fazer experiências com o modelo na Pesquisa, para acelerar a Search Generative Experience (SGE). 

O Gemini Pro vai estar disponível para programadores e clientes empresariais, através da API Gemini no Google AI Studio, ou no Google Cloud Vertex AI, a partir do dia 13 de dezembro. Os programadores de soluções para Android também poderão usar o Gemini Nano, através do AICore no Android 14, nos smartphones Pixel 8 Pro.

O Gemini Ultra vai começar a ser disponibilizado para programadores e clientes empresariais no início do próximo ano, uma vez que a Google ainda está a concluir o processo de verificação de confiança e segurança desta versão do modelo. Entre as novidades previstas para 2024 está também o Bard Advanced, uma nova versão do chatbot da Google que recorre ao Gemini Ultra.

Nota de redação: A notícia foi atualizada com mais informação. (Última atualização: 16h20)