Erst im Mai dieses Jahr besiegte die Künstliche Intelligenz AlphaGo den Go-Weltmeister und sorgte internation für viel Aufsehen.
Wie The Verge nun berichtet, soll die neueste Version der Software, genannt AlphaGo Zero, noch besser sein. Im Gegensatz zu ihren Vorgängern braucht die neue Variante nämlich keine Unmengen an Datensätzen mehr, um das komplizierte Brettspiel zu verstehen.
KI spielt gegen sich selbst
Alles was die Entwickler taten, war, der KI die Grundregeln des Spiels beizubringen. Alles weitere „lernte“ die Software von ganz alleine, in dem sie wieder und wieder gegen sich selbst spielte. Zum Vergleich: die vorherige Version, die den Weltmeister besiegte, wurde im Vorfeld mit den Daten aus rund 100.000 geführten Go-Partien gefüttert und baute darauf ihr „Wissen“ auf.
AlphaGo Zero schlägt Vorgängen um Längen
Um nun selbstständig zu „lernen“, führte die Software zu Beginn beliebige Züge auf dem Brett aus. Gewann sie das Match gegen sich selbst, prägte sich die KI die erfolgreichsten Strategien ein und spielte erneut. Diesen Prozess wiederholte die Software millionenfach. Drei Tage Training genügten der neuen Version AlphaGo Zero. Im Anschluss war es ihr möglich die Software zu besiegen, die im Mai den Weltmeister schlagen konnte. Nach 40 Tagen lag die Gewinnwahrscheinlichkeit gegen die ausgereifteste Version der alten Software bei 90 Prozent. Googles Ableger Deep Mind bezeichnet die KI daher als „besten Go-Spieler in der Geschichte“.
Der Chef-Entwickler von AlphaGo Zero, David Silver, ist begeistert von den Fortschritten der KI. „Ohne durch Menschen hinzugefügte Informationen, ohne menschliches Wissen in irgendeiner Form genutzt zu haben, haben wir die Begrenzungen dessen, was möglich ist, aufgehoben“, so Silver auf einer Pressekonferenz.
Schnelle Entwicklung der Fähigkeiten
Die KI habe, wie ein Mensch auch, mit einfachen, vorsichtigen Zügen begonnen das Spiel zu verstehen und habe dann Schritt für Schritt auch die Züge und Strategien ausführen können, die die besten menschlichen Go-Spieler nutzen. AlphaGo Zero war dann schnell soweit eigene Züge und Strategien zu entwickeln, die menschliche Spieler so noch nie ausgeführt haben.
Neben den Fortschritten der Software sind auch große Sprünge in der Hardware gelungen. Waren zuvor noch 48 eigens von Google entwickelte KI-Chips, sogenannte TPUs, notwendig um AlphaGo zu betreiben, werden mit der neuen Version nur noch vier benötigt. Das System sei so viel flexibler und mit weniger Aufwand zu betreiben, so die Entwickler.
Weitere Informationen zu AlphaGo findet ihr im Video.
Das könnte auch interessant sein: