
O modelo, recebeu o nome de código FoxBrain e foi originalmente concebido para as aplicações internas do grupo Hon Hai, mas a intenção é disponibilizá-lo em código aberto e "partilhado publicamente no futuro", afirmou a empresa, em comunicado. Fundada em 1974, a Foxconn é o maior fabricante mundial de eletrónica, com fábricas e centros de investigação na China, Índia, Japão, Vietname e Estados Unidos, sendo o maior parceiro da Apple.
O FoxBrain não só tem "poderosas capacidades de compreensão e raciocínio", como também está "otimizado para o estilo de linguagem dos utilizadores taiwaneses, mostrando um excelente desempenho em testes de raciocínio matemático e lógico", lê-se na mesma nota.
"O nosso modelo FoxBrain adotou uma estratégia de formação muito eficiente, centrando-se na otimização do processo de formação e não na acumulação cega de poder computacional", afirmou Li Yung-hui, diretor do Centro de Investigação de Inteligência Artificial (IA) do Instituto Hon Hai, a entidade responsável por este desenvolvimento.
"Através de métodos de formação cuidadosamente concebidos e da otimização de recursos, construímos com êxito um modelo de IA local com poderosas capacidades de raciocínio", afirmou.
Para treinar o modelo, que se baseia na arquitetura Meta Llama 3.1 com 70 mil milhões de parâmetros, a Hon Hai utilizou 120 unidades de processamento gráfico (GPU) Nvidia H100 numa rede Nvidia Quantum-2 InfiniBand.
Em termos de desempenho de aplicação, a Hon Hai disse que o FoxBrain mostrou "melhorias gerais em matemática" em comparação com o modelo básico Meta Llama 3.1 e "ganhos significativos" em relação ao Taiwan Llama, outro modelo extensivo de idioma chinês tradicional.
"Embora ainda exista uma ligeira diferença em relação ao modelo do DeepSeek, o desempenho [do FoxBrain] já se aproxima dos padrões líderes mundiais. Em comparação com os modelos de inferência recentemente lançados no mercado, este método mais eficiente e económico constitui um novo marco para o desenvolvimento da IA em Taiwan", afirmou a empresa tecnológica.
O desenvolvimento deste extenso modelo de linguagem é o mais recente exemplo de colaboração entre a Nvidia e a Foxconn: a empresa asiática é o principal fabricante dos servidores GB200 da empresa norte-americana, que são fundamentais para o desenvolvimento de aplicações de IA de ponta.
Pergunta do Dia
Em destaque
-
Multimédia
Microsoft: 50 anos de história e os marcos da empresa que redefiniu o software na computação pessoal -
App do dia
ColorSlurp: Não encontra a cor certa? Esta app dá uma ajuda nos projetos criativos -
Site do dia
Encontre o tipo de letra ideal para os seus projetos online com a Free Faces -
How to TEK
Instagram muda layout e substitui quadrados por retângulos nos perfis. Como se adaptar ao novo formato?
Comentários