
Minecraft, que tem adaptação a filme agendado para o cinema nos próximos dias, continua a ser um dos videojogos mais populares de sempre. Mas também é uma ferramenta que está a ser utilizada para treinar modelos de inteligência artificial.
A DeepMind, divisão da Google dedicada à investigação de IA, realizou mais um passo notável no que diz respeito ao treino do seu modelo. Conseguiu pela primeira vez descobrir como se mina diamantes em Minecraft, considerado pelos jogadores uma das tarefas mais difíceis de realizar, obrigando a múltiplos passos, como foi partilhado na Nature. O curioso é que o modelo de IA usado, conhecido como Dreamer, não foi ensinado como o fazer. Este passo é considerado importante na direção de gerar conhecimento aprendido num domínio, expandido para novas situações.
Segundo o cientista de computação da DeepMind, Danijar Hafner, o sistema permite à IA compreender o ambiente físico e melhorar-se automaticamente ao longo do tempo, sem que um humano tenha de lhe dizer exatamente o que fazer. Neste caso, a IA conseguiu obter um dos recursos mais raros e difíceis de encontrar, que é utilizado para criar objetos.
O que eleva o desafio na aprendizagem em Minecraft é que os mundos são gerados aleatoriamente, ou seja, duas experiências de jogo nunca são iguais. E isso torna desafiante para os sistemas de IA aprenderem, pois precisam de compreender o que está à sua frente para poderem agir, não sendo possível memorizar o local das coisas, pois estes mudam a cada nova partida.
Pedir à IA que encontre diamantes sem lhe explicar como o fazer é um avanço que os cientistas dizem ser importante, porque ao jogador, para os obter, precisam de executar vários passos, tais como encontrar árvores e desmanchá-las para aceder a madeira. Depois precisam de construir uma mesa de construção de itens. Depois construir ferramentas como picaretas, até conseguir os materiais necessários para cavar a terra fundo até então encontrar os diamantes, enterrados bem fundo.
Para executar esta tarefa, o Dreamer utiliza um sistema de tentativa-erro chamado aprendizagem reforçada, identificando ações que provavelmente gerem recompensas, repetindo-as e descartando aquelas que não levaram a nada. A IA vai tentando fazer novas ações, procurando prever as potencias recompensas de diferentes decisões.
A DeepMind diz que esta habilidade vai permitir criar robots que possam aprender a interagir com o mundo real, onde os custos de executar tarefas tentativa-erro são mais dispendiosos do que fazê-las num videojogo. No caso dos diamantes de Minecraft, a construção de todo o um algoritmo sem ter isso em mente pode ser ideal para testar situações fora da caixa ou tarefas que não sejam familiares.
Durante a experiência no jogo, a equipa de investigação utilizou um protocolo que dava ao Dreamer uma recompensa cada vez que este completasse uma das 12 etapas progressivas para obter o diamante. Estas recompensas incentivaram a IA a selecionar as ações que muito provavelmente a premiasse. Para dificultar a tarefa, os investigadores desligavam o jogo a cada 30 minutos, para que a IA não se acostumasse a essa configuração do cenário, obrigando-a a recomeçar sempre do zero, mas no processo aprendesse as regras para obter as recompensas.
No fim, foram necessários cerca de nove dias para a IA completar os passos para encontrar o primeiro diamante. Atualmente, um jogador experiente consegue fazê-lo em 20-30 minutos.
Pergunta do Dia
Em destaque
-
Multimédia
Xiaomi "ataca" Porsche e automóveis de alta cilindrada com o elétrico SU7 Ultra abaixo dos 70 mil euros -
App do dia
Mister Antonio: Salte entre planetas e resolva desafios para agradar a um gato muito exigente -
Site do dia
Tem uma montanha de tarefas pela frente? Esta extensão ajuda a manter tudo organizado a partir do browser -
How to TEK
Aumente a privacidade e “tape os ouvidos” ao seu smartphone
Comentários