Nova versão da IA AlphaGo aprende sozinha a ganhar

23 out 2017 17:08

Este artigo tem mais de 7 anos

Depois do AlphaGo ter vencido cinco dos melhores jogadores de Go do mundo ao mesmo tempo, a DeepMind subiu a fasquia. O AlphaGo Zero aprendeu sozinho a dominar o jogo de tabuleiro chinês e venceu as 100 partidas de Go disputas contra a versão original.

Enquanto que o “treino” do AlphaGo passou pelo estudo dos movimentos de mais de 100 mil partidas de Go entre humanos, a versão Zero aprendeu a ganhar a sós com o tabuleiro e com as peças, sem qualquer interferência humana.

Isto foi possível graças à construção de um algoritmo de Machine Learning com as regras do jogo que, sustentado por uma rede neural baseada na aprendizagem por reforço, permite que a máquina aprenda sozinha ao jogar milhões de vezes consecutivas contra si mesma num ambiente virtual.

Se inicialmente, as jogadas da IA eram aleatórias, com cada vitória havia uma atualização do sistema e uma nova aprendizagem. Ao repetir deste esquema, o AlphaGo Zero começou a desenvolver as suas próprias estratégias.

E, bastaram apenas três dias para dominar um jogo de 3.000 anos e vencer a sua antecessora, AlphaGo. Em 100 partidas, a versão Zero conseguiu o pleno. Ao fim de 40 dias de treino, a taxa de vitórias da Zero sobre a AlphaGo era de 90%.

A explicação do desenvolvimento da nova versão do Alpha Go foi publicada na revista científica Nature e, para a equipa da DeepMind, “um objetivo antigo da inteligência artificial é um algoritmo que aprenda, tabula rasa, a ter uma proficiência sobrehumana em domínios complexos”, referem no artigo publicado. “Começando tabula rasa, o nosso novo programa, Alpha Go Zero, alcançou um desempenho sobrehumano.”

Os investigadores concluíram que "É possível treinar até um nível sobrehumano, sem exemplos ou orientação humana, e sem nenhum conhecimento para além das regras básicas.”

Pergunta do Dia

Em destaque

Últimas

Casa dos Bits · Ciência · 26 abr 2025 17:12

Tabela Periódica de Machine Learning cruza algoritmos para melhorar modelos de inteligência artificial

por Rui Parreira
Casa dos Bits · Equipamentos · 26 abr 2025 15:50

OnePlus 13T aposta na potência com o processador Snapdragon 8 Elite e traz uma bateria generosa

por Francisca Andrade
Casa dos Bits · Multimédia · 26 abr 2025 13:45

Clair Obscur: Expedition 33 é uma carta de amor de França aos RPGs japoneses

por Rui Parreira
Casa dos Bits · Computadores · 26 abr 2025 11:30

Meta disponibiliza traduções em tempo real nos óculos inteligentes Ray-Ban

por Rui Parreira
Casa dos Bits · Site do dia · 26 abr 2025 09:20

Petição quer convencer editoras discográficas a desistir de ação contra o Internet Archive

por Rui Parreira
Casa dos Bits · Apps · 25 abr 2025 20:14

Treine o cérebro com desafios diários no “ginásio” de bolso da Brainwell

Comentários

Entre com a sua conta do Facebook ou registe-se para ver e comentar

Relacionados Playlist

Autoplay

Nova versão da IA AlphaGo aprende sozinha a ganhar

Pergunta do Dia

Em destaque

Multimédia

App do dia

Site do dia

How to TEK

Últimas

Comentários

Relacionados Playlist

Nova versão da IA AlphaGo aprende sozinha a ganhar

Pergunta do Dia

Veja também

Em destaque

Multimédia

App do dia

Site do dia

How to TEK

Comentários

Veja também