A OpenAI apresentou esta quinta-feira o GPT-4o mini. O novo modelo de linguagem da dona do ChatGPT é mais pequeno e mais barato que os outros LLMs já lançados pela empresa e segue uma tendência que outras tecnológicas do sector também estão a adotar.

A novidade foi lançada para programadores e através do site e app móvel do ChatGPT. Para utilizadores empresariais fica disponível a partir da próxima semana. A dona do ChatGPT garante que o GPT-4o mini supera as capacidades dos modelos equivalentes da concorrência em tarefas que envolvam texto e visão, sem revelar o tamanho do GPT-4o mini.

A opção passa a substituir o GPT-3.5 Turbo, enquanto modelo mais pequeno na oferta da OpenAI, e isso também significa que exige menos recursos, razão pela qual também é mais barato. A OpenAI garante mesmo que é 60% mais barato que o GPT-3.5 Turbo.

Veja a comparação

Comparação custos GPT OpenAI
Comparação custos GPT OpenAI

Os modelos de IA de menor dimensão estão a ganhar destaque por serem uma alternativa mais eficiente em termos de custos e velocidade. Têm-se revelado uma boa opção para tarefas mais simples e mais direcionadas, graças à sua eficiência.

"O GPT-4o mini permite uma ampla gama de tarefas com o seu baixo custo e latência, como aplicações que precisam de recorrer a várias APIs; que passam um grande volume de contexto para o modelo (históricos de conversas, por exemplo); ou interagem com os clientes por meio de respostas de texto rápidas e em tempo real (como os chatbots)", explica uma nota publicada no site da empresa a propósito.

Dados da Artificial Analysis, divulgados pela tecnológica liderada por Sam Altman, revelam já que o GPT-4o conseguiu 82% nos testes MMLU, um referencial para avaliar as capacidades de raciocínio dos LLMs. Por comparação, o Gemini 1.5 Flash terá conseguido 79% nos mesmos testes e o Claude 3 Haiku 75%. George Cameron, co-fundador da consultora, confirmou ainda ao Tech Crunch que o novo mini é duas vezes mais rápido que GPT-4o e que o GPT-3.5 Turbo, sendo uma boa alternativa para casos de utilização onde uma resposta rápida é mais necessária.

Para os programadores que utilizam a API da OpenAI, o GPT4o mini custa 15 cêntimos por milhão de tokens de input e 60 cêntimos por milhão de tokens de output. O modelo foi treinado com informação criada até outubro de 2023 e tem uma janela de contexto de 128.000 tokens. Para já o modelo só suporta texto e imagem. No futuro, o plano é que suporte também vídeo e áudio.

No mesmo dia, a OpenAI anunciou novas ferramentas para clientes empresariais, como uma Enterprise Compliance API, para ajudar sectores mais regulados a cumprirem com requisitos de acesso e transparência. Este recurso vai proporcionar acesso a informação que poderá ser usada para fazer auditorias e agir sobre os dados que usam através do ChatGPT.