Mais poderoso que o DeepSeek? Alibaba entra na corrida dos modelos de IA com mais capacidade

Casa dos Bits

Rui Parreira

29 jan 2025 10:24

Computadores

A Alibaba lançou uma nova versão do modelo Qwen 2.5-Max e garante que é mais poderoso que o rival chinês DeepSeek-V3.

Depois da DeepSeek ter disparado como o modelo de IA generativo mais poderoso e a redefinir “as regras” neste campo, mas também com preocupações a nível de segurança, entra em jogo a Alibaba. A gigante do retalho chinês há muito que tinha anunciado o investimento na tecnologia, com o objetivo de ajudar nos seus negócios, mas também disponível em aplicações práticas para os consumidores.

A empresa tem vindo a melhorar o modelo Qwen 2.5-Max, que foi lançado em maio de 2024, sucessor do Tongyi Qianwen disponibilizado em 2023. Baseado em modelos de inteligência artificial open source, o seu sistema oferece tecnologia texto-para-vídeo, estando na corrida com o ChatGPT ou Gemini. Mas no rescaldo da entrada em cena do DeepSeek, a Alibaba acaba de lançar uma nova versão do Qwen 2.5-Max e afirma que é mais poderoso que o compatriota DeepSeek-V3.

Como é noticiado pela Reuters, o DeepSeek não apenas abalou a concorrência a nível internacional, como internamente parece ter criado uma corrida no mercado doméstico chinês. O facto da Alibaba ter escolhido o lançamento do seu novo modelo em dia de feriado, com a entrada do Novo Ano Lunar, em que praticamente ninguém trabalha no país, pode representar a pressão causada pelo novo concorrente.

A Alibaba disse em comunicado na rede social WeChat, que o Qwen 2.5-Max ultrapassou as capacidades do GPT-4o, o DeepSeek-V3 e o Llama-3.1-405B da Meta. A corrida pelos modelos de IA mais poderosos mexeu com outras empresas, como a ByteDance, dona do TikTok, que também atualizou o seu modelo de IA, Doubao-1.5-pro, afirmando que ultrapassou o OpenAI o1 no benchmark AIME, utilizado para avaliar a capacidade dos modelos de IA compreenderem e responderem a questões complexas.

Independentemente de qual é o modelo mais poderoso disponível, as atenções que a DeepSeek está a receber diz respeito ao custo de desenvolvimento da sua inteligência artificial. Fundada em 2023 por Liang Wenfeng, a DeepSeek usa técnicas inovadoras como aprendizagem por reforço e arquiteturas eficientes, incluindo a ativação seletiva de parâmetros (MoE, Mixture of Experts). E nesse sentido, o modelo foi treinado por cerca de 6 milhões de dólares, quando comparado com o custo de 100 milhões ou mais que custam os rivais ocidentais.

Além disso, a empresa adota uma abordagem open source, permitindo que os seus modelos sejam usados e adaptados livremente por comunidades de desenvolvimento. Esta estratégia contribui para a democratização do acesso à IA, ao mesmo tempo que coloca pressão sobre os preços praticados por empresas rivais.