Die von der Google-Tochter DeepMind entwickelte, auf Spiele ausgelegte künstliche Intelligenz AlphaZero kann jetzt auch Schach spielen, wie der Guardian berichtet. Die eigenständig lernende Software hat weniger als vier Stunden gebraucht, um sich zu einem unbesiegbaren Großmeister zu entwickeln und brauchte dazu keinerlei vorprogrammierte Kenntnisse. Den Beweis für seine Lernerfolge erbrachte AlphaZero, indem es das höchstbewertete Schachprogramm der Welt, Stockfish 8, in einer Serie aus 100 Spielen ohne Niederlage bezwang.
Googles AlphaZero lernte Schach ohne menschliches Zutun
Die KI hat alle Spiele gewonnen oder zumindest remisiert, wie aus einem Forschungspapier hervorgeht. „Von zufälligen Zügen ausgehend hat AlphaZero allein auf Basis der Spielregeln in weniger als 24 Stunden übermenschliche Fähigkeiten in den Spielen Schach, Shogi und Go erreicht und zur Demonstration in jedem Spiel einen Weltmeister in überzeugender Art geschlagen“, heißt es in der Publikation, die unter anderem vom DeepMind-Gründer Demis Hassabis verfasst wurde.
AlphaZero spielt immer wieder gegen sich selbst
Gegen Stockfish 8 hat kein Mensch eine Chance. Im Schach ist das allerdings nichts neues. Was den Sieg von AlphaZero gegen den Maschinenweltmeister im Schach beeindruckend macht, ist dass sich die KI das Spiel in nur vier Stunden angeeignet hat. Das Programm bekommt die Regeln vorgegeben und spielt dann immer wieder gegen sich selbst. Dabei passt es seine Strategien permanent an und wird immer besser. Obwohl das Programm viel weniger mögliche Spielpositionen berücksichtigt als Stockfish, spielt es am Ende besser.
Auch in Shogi und Go in kurzer Zeit siegreich
AlphaZero hat die ersten 25 Partien gegen Stockfish gewonnen, allerdings mit dem Vorteil der Spieleröffnung mit den weißen Figuren. Dann hat es drei Partien mit den schwarzen Figuren gewonnen und 72 Unentschieden erzielt. Im japanischen Spiel Shogi hat AlphaZero nach zwei Stunden Lernzeit 90 von 100 Spielen gegen das Weltmeisterprogramm Elmo gewonnen, bei acht Niederlagen und zwei Unentschieden. Auch in Go erreichte die KI nach acht Stunden ein Niveau, das ihr erlaubte, 60 von 100 Spielen gegen ihren auf Go spezialisierten Vorgänger AlphaGo (gegen den die besten menschlichen Spieler verloren haben) zu gewinnen, bei 40 Niederlagen.