Os investigadores, que publicaram as suas conclusões num artigo na revista científica Science, começam por explicar que modelos de IA como o GPT-4 da OpenAI têm a capacidade de aprender e usar linguagem humana, num processo que se baseia em biliões de inputs. Já os bebés, recebem apenas milhões de palavras por ano.

Para pôr a prova a sua teoria, a equipa teria de treinar um modelo de IA não com recurso a uma vasta quantidade de dados extraídos da Internet, mas sim a partir dos inputs que um bebé recebe.

Para tal, os investigadores acompanharam a forma como um bebé aprendeu desde os seis meses aos dois anos. De modo a registar este processo de aprendizagem, foi utilizada uma pequena câmara, colocada numa espécie de capacete, usada pela criança durante cerca de uma hora por semana.

Clique nas imagens para ver com mais detalhe 

As mais de 60 horas de gravações foram depois transcritas, resultando em quase 250.000 exemplos de palavras, incluindo repetições. Os investigadores fizeram correspondências entre as palavras ouvidas na gravação e o que o bebé estava a ver ou a fazer.

Os dados recolhidos foram usados para treinar um modelo de IA multimodal, em combinação com um algoritmo. Com o treino completo, o modelo foi posto à prova pela equipa, que recorreu ao mesmo tipo de avaliação que é utilizada para perceber a capacidade de aprendizagem de palavras em bebés.

O modelo conseguiu aprender uma quantidade substancial de palavras e conceitos. Além disso, demonstrou que também é capaz de generalizar algumas das palavras aprendidas, aplicando-as a contextos visuais diferentes daqueles que foram vistos durante os treinos

Veja o vídeo 

Wai Keen Vong, investigador na NYU e um dos principais autores do estudo, afirma que os resultados da investigação demonstram como os mais recente avanços algorítmicos, combinados com a experiência natural de uma criança, têm o potencial mudar o nosso entendimento sobre o processo de aquisição e desenvolvimento de linguagem.

Já Brenden Lake, investigador na NYU e também um dos principais autores do estudo, realça que a utilização de modelos de IA para estudar o processo humano de aprendizagem de linguagem poderá ajudar a resolver alguns dos debates que existem acerca dos “ingredientes” necessários para as crianças aprenderem palavras.