Stroj se učil samostatně a teď exceluje v šachách

16. září 2015

Magazín Leonardo

Šachy|foto:Fotobanka stock.xchng

Počítač, vybavený algoritmy umělé inteligence, pracujícími na základě metody deep learning, se za 72 hodin naučil sám hrát šachy natolik, že dosáhl úrovně mezinárodního mistra.

Šachy jsou indikátorem schopností umělé inteligence (AI) již od padesátých let a podržují si tuto roli dodnes, i když klasická doba tohoto oboru již dávno skončila. Deep learning je poměrně nová metoda strojového učení, které používá komplikované algoritmy, které fungují na více úrovních a používají abstraktní modely a reprezentace v rámci určité oblasti, které má umělá inteligence “pochopit”.

Již před 18 lety porazil počítač Deep Blue od firmy IBM poprvé lidského šachového šampiona Garyho Kasparova. Donedávna však lidský hráč, vybavený šachovým softwarem (tzv. kentaur čili smíšený pár), mohl porazit v regulérní hře jiné šachové programy, provozované na počítači. Zdá se však, že to už neplatí, protože počítačové šachové programy se od lidských hráčů odpoutaly, staly se neuvěřitelně rychlými a také se vydaly na samostatnou cestu učení a sebezdokonalování, kdy již asistenci lidských hráčů téměř nepotřebují. Kentaur může být nyní důstojným soupeřem čistého softwaru jen při dostatečném zpomalení hry, například při korespondenčním šachu.

Giraffe – software se sítí neuronů

Tento vývoj v poslední době souvisí s faktem, že moderní programy umělé inteligence již v šachu nepostupují pouze metodou hrubé síly, ale podobně jako lidští hráči jsou schopny “kvalitativního” postupu podle jistých vzorců. K tomuto pokroku nyní přispěl i Matthew Lai z Imperial College London, který vyvinul AI software s názvem Giraffe. Giraffe obsahuje tzv. hlubokou neuronovou síť se čtyřmi úrovněmi, která je schopna kvalifikovaně vyhodnocovat automaticky hrané partie, vzorce v nich obsažené a učit se z nich, navíc prakticky bez zásahu lidského šachového hráče nebo programátora, jen s dostupnými velkými databázemi reálných her, s celkovým úvodním počtem 175 milionů pozic.

Posléze je program otestován, jak je schopen rozeznat strategickou hodnotu 1500 vybraných významných šachových pozic. Počítač se tak naučí znát hodnotné pozice a tahy. Giraffe si velmi dobře vede i při otevíráních a koncovkách her.

Velmi brzy po své iniciaci a zaučení Girrafe hrál (na běžných dnešních počítačích) na úrovni nejlepších konvenčních šachových programů či mezinárodních mistrů, kteří tvoří přibližně 2% všech turnajových hráčů. Matthew Lai chce později své postupy využit i při hraní jiných her, třeba Go.

Zdroje: MIT Technology Review 1, MIT Technology Review 2, Marginal Revolution, Recode, The Business Insider, arXiv, Phys.Org, Popular Science, Wikipedia