Depois da DeepSeek ter disparado como o modelo de IA generativo mais poderoso e a redefinir “as regras” neste campo, mas também com preocupações a nível de segurança, entra em jogo a Alibaba. A gigante do retalho chinês há muito que tinha anunciado o investimento na tecnologia, com o objetivo de ajudar nos seus negócios, mas também disponível em aplicações práticas para os consumidores.
A empresa tem vindo a melhorar o modelo Qwen 2.5-Max, que foi lançado em maio de 2024, sucessor do Tongyi Qianwen disponibilizado em 2023. Baseado em modelos de inteligência artificial open source, o seu sistema oferece tecnologia texto-para-vídeo, estando na corrida com o ChatGPT ou Gemini. Mas no rescaldo da entrada em cena do DeepSeek, a Alibaba acaba de lançar uma nova versão do Qwen 2.5-Max e afirma que é mais poderoso que o compatriota DeepSeek-V3.
Como é noticiado pela Reuters, o DeepSeek não apenas abalou a concorrência a nível internacional, como internamente parece ter criado uma corrida no mercado doméstico chinês. O facto da Alibaba ter escolhido o lançamento do seu novo modelo em dia de feriado, com a entrada do Novo Ano Lunar, em que praticamente ninguém trabalha no país, pode representar a pressão causada pelo novo concorrente.
A Alibaba disse em comunicado na rede social WeChat, que o Qwen 2.5-Max ultrapassou as capacidades do GPT-4o, o DeepSeek-V3 e o Llama-3.1-405B da Meta. A corrida pelos modelos de IA mais poderosos mexeu com outras empresas, como a ByteDance, dona do TikTok, que também atualizou o seu modelo de IA, Doubao-1.5-pro, afirmando que ultrapassou o OpenAI o1 no benchmark AIME, utilizado para avaliar a capacidade dos modelos de IA compreenderem e responderem a questões complexas.
Independentemente de qual é o modelo mais poderoso disponível, as atenções que a DeepSeek está a receber diz respeito ao custo de desenvolvimento da sua inteligência artificial. Fundada em 2023 por Liang Wenfeng, a DeepSeek usa técnicas inovadoras como aprendizagem por reforço e arquiteturas eficientes, incluindo a ativação seletiva de parâmetros (MoE, Mixture of Experts). E nesse sentido, o modelo foi treinado por cerca de 6 milhões de dólares, quando comparado com o custo de 100 milhões ou mais que custam os rivais ocidentais.
Além disso, a empresa adota uma abordagem open source, permitindo que os seus modelos sejam usados e adaptados livremente por comunidades de desenvolvimento. Esta estratégia contribui para a democratização do acesso à IA, ao mesmo tempo que coloca pressão sobre os preços praticados por empresas rivais.
Pergunta do Dia
Em destaque
-
Multimédia
Skyrider X1 é um motociclo anfíbio que se desloca na terra, água e ar -
App do dia
A música feita à medida pela IA da Suno também tem app para Android e iOS -
Site do dia
Campanha promove uso de conteúdo legal online em Portugal -
How to TEK
Precisa de libertar espaço no Gmail? Conheça três formas de apagar rapidamente mensagens
Comentários