Translate

28 janeiro 2019

AlphaZero

No final de 2018, a chinesa Ju Wenjun (rating de 2578, na data de hoje) confirmou o título mundial de xadrez feminino. Quase na mesma época, o norueguês Magnus Carlsen (rating de 2844, hoje) derrotou o desafiante Fabiano Caruana para manter seu título. Carlsen talvez seja o maior jogador na história do xadrez, acima de Fisher ou Kasparov. Também no final do ano, o programa Stockfish novamente ganhava o título de software de campeão de xadrez (rating de 3390).

A versão 8 do Stockfish pesquisa 70 milhões de posições por segundo. É algo realmente assombroso. Mas em dezembro, o Stockfish levou um surra de um programa que pesquisa somente 80 mil posições por segundo.

O AlphaZero é um software desenvolvido pela mesma empresa que criou o AlphaGo, que derrotou o campeão mundial de Go, um feito que muitas pessoas achavam que não ocorreria tão cedo. O programa foi programado para treinar com ele mesmo, sem usar jogos passados ou teoria. Apenas programação, com redes neurais. Com quatro horas de treinamento, o Alpha Zero estava jogando melhor que o Stockfish 8 (e melhor que Carlsen, obviamente). Depois de 9 horas de treino, o AlphaZero jogou 100 partidas de xadrez contra o Stockfish 8 e ganhou 28 e empatou 72.

Além disto, o AlphaZero joga também Go e Shoji (um tipo de jogo de estratégia japonês). Ele jogou contra a versão AlphaGo e venceu. Como o AlphaZero analisa menos posições, a qualidade da sua análise é muito melhor. O estilo de jogo do programa foi elogiado por Kasparov, o ex-campeão mundial de xadrez que foi derrotado por um antecessor, chamado DeepBlue.

Em razão dos resultados, o AlphaZero está sendo considerado hoje o auge da pesquisa de inteligência artificial no mundo. Conforme lembra um especialista da área:

(...) o próximo passo é usar suas capacidades para resolver problemas do mundo real - como o dobramento de proteínas, que é responsável por doenças como Alzheimer, Parkinson e fibrose cística. Mas ele também espera que o AlphaZero seja capaz de desenvolver materiais mais fortes e leves, melhores remédios e eventualmente se tornar flexível o suficiente para se adaptar a novas situações.

Enquanto o DeepBlue foi programado para jogar xadrez, o AlphaZero aprendeu a jogar xadrez. O próximo passo talvez seja colocar o AlphaZero para jogos com informações ocultas, como pôquer. O fato é tão relevante que deu origem a um artigo na prestigiosa revista Science, de Kasparov.

Nota 1: Aqui tem algumas das partidas. Em uma delas, o Alphazero sufoca o Stockfish com os peões.

Nota 2: Existem algumas críticas. O GM, e um dos maiores jogadores da atualidade, Nakamura (rating 2744 no tradicional, segundo melhor jogador do mundo no rápido e terceiro no blitz) chama a atenção para o fato das condições não serem as mesmas e que as partidas com o Stockfish não são comparáveis, pelo fato do AlphaZero estar usando um supercomputador. Ou seja, o hardware não era igual.

Nota 3: O Alphazero é uma empresa do Google.

Imagem, fonte aqui

Nenhum comentário:

Postar um comentário