A Meta lançou esta terça-feira uma atualização do modelo de inteligência artificial Llama 3. Entre as novidades encontram-se melhorias na sua capacidade multilinguagem, assim como uma otimização da performance geral. O objetivo da empresa de Mark Zuckerberg é que o seu modelo seja cada vez mais uma alternativa gratuita aos sistemas pagos de rivais como a OpenAI, ainda que se assuma como pequeno.

Segundo é referido no blog da Meta, o novo modelo do Llama 3 pode conversar em oito línguas, escrever código de computação de maior qualidade, assim como resolver problemas matemáticos mais complexos que as versões anteriores.

O modelo apresenta 405 mil milhões de parâmetros, um aumento significativo face a versões anteriores, mas mais pequeno quando comparado com o GPT-4 da OpenAI que tem 1 bilião de parâmetros. Segundo a Reuters, a Amazon está a preparar um modelo capaz de gerir 2 biliões de parâmetros.

No documento de apresentação da nova versão é referido que os modelos Llama oferecem o menor custo por token da indústria. A estratégia de Mark Zuckerberg é manter o modelo open source, só assim garante que mais pessoas em todo o mundo tenham acesso aos benefícios e oportunidades da IA. Acredita que este poder computacional não deve estar concentrado nas mãos de alguns e que a tecnologia pode ser lançada de forma segura na sociedade. “Por isso continuamos a dar os passos no caminho para o acesso aberto à IA para se tornar no standard da indústria”, destaca o líder da Meta.

Meta e Microsoft lançam modelo de linguagem Llama 2 gratuito para investigação e uso comercial
Meta e Microsoft lançam modelo de linguagem Llama 2 gratuito para investigação e uso comercial
Ver artigo

Mark Zuckerberg compara a atual corrida da IA aos primeiros tempos da computação de alta performance, quando as grandes tecnológicas investiram fortemente a desenvolver os seus sistemas fechados baseados em Unix. Neste tempo era difícil imaginar outra abordagem para este tipo de software.

Mas foi o Linux, sistema open source, que foi ganhando popularidade, tornando-se mais avançado, seguro e acessível que os sistemas fechados Unix. “Atualmente, o Linux é o standard da indústria para a computação em cloud e sistemas operativos que alimentam a maioria dos equipamentos mobile. E estamos a beneficiar de produtos superiores por causa disso”, acrescentou.

Além do modelo principal, a Meta está também a atualizar os seus modelos mais leves, de 8 mil milhões de parâmetros e o de 80 mil milhões que foram lançados na Primavera. A Reuters destaca o benchmark MATH, que testa o nível de capacidade de resolver cálculos matemáticos. O modelo da Meta obteve uma pontuação de 73,8, enquanto que o GPT-4o obteve 76,6. Em terceiro surge o Claude 3.5 da Sonnet com 71,1 pontos.

As pontuações aproximam-se ainda mais no benchmark MMLU, que cobre diversos temas, como a matemática, ciência e humanísticas, em que o modelo da OpenAI ficou apenas a uma décima à frente do da Meta.