KI mit Siebenmeilenstiefeln in eine glorreiche Zukunft

Es steht zu vermuten, dass die künstliche Intelligenz (KI) auch künftig an ihre Grenzen stösst und mit menschlichen Fähigkeiten à la Abstraktion nichts am Hut hat. Dessen ungeachtet schnitt bereits 2015 die von MIT-Forschern entwickelte Data Science Machine in einem Test besser ab als die Personen der 906 Versuchsgruppen.

Im Unterschied zu diesen benötigte die Software bei Trefferquoten von 87 bis 95 Prozent nicht Monate, sondern lediglich 2 bis 12 Stunden für eine richtige Prognose. Mittlerweile erkundet die KI die Umwelt, lässt Glücksspieler alt aussehen und entpuppt sich gar als veritables Bewegungstalent.

Für audiovisuelle Eindrücke empfänglich

Wie keinen Zweiten charakterisiert die abgedroschene Redensart "Bescheidenheit ist eine Zier, doch weiter kommt man ohne ihr" Demis Hassabis, den Gründer von DeepMind. Für ihn ist ohne Wenn und Aber die künstliche Intelligenz die Antwort auf alle offenen Fragen. Mit dem Kauf seiner 2010 gegründeten KI-Schmiede macht Google jedenfalls deutlich, dass in DeepMind ungeheures Potenzial steckt und an der Vision des Mannes was dran ist. Dass der Technologieriese scheinbar kein allzu grosses Vertrauen zu den Fähigkeiten der holden Weiblichkeit hegt, steht dabei auf einem anderen Blatt.

DeepMind kann die Kritik ohnehin nichts anhaben, zumal das Unternehmen seit alters für Überraschungen gut ist. Auch die jüngste Errungenschaft, die audiovisuelle Erkennung von Objekten durch künstliche Intelligenz, sorgt für Furore. Nicht länger bedarf es einer Unzahl begrifflich klassifizierter Bilder, um die KI zur Identifikation beispielsweise einer Katze zu befähigen. Das betreute Lernen ist damit Schnee von gestern. Oder um mit dem Schweizer Computervisionär Paolo Favaro zu sprechen: "Menschen läuft auch niemand hinterher, der ihnen ständig erklärt, was sie sehen."

Mit sehr spezifischen Technologielösungen wie Blubrake und HiRide, dem innovativen Brems- und Stossdämpfersystem für Fahrräder, mag die Forschungsarbeit des Professors nichts gemein haben, endlich aber spielen auch in seiner Grundlagenforschung intelligente Algorithmen eine massgebliche Rolle. Während diese bei den Fahrrädern dafür sorgen, dass Gefahrenmomente wie die Blockierung des Vorderrades rechtzeitig erkannt werden, spüren sie am Institut für Informatik an der Universität Bern ähnlichen Geheimnissen nach wie die KI von DeepMind. So geht es im Forschungsprojekt "Form lernen" etwa darum, die visuelle Erfahrung des Menschen maschinell umzusetzen.

Mit nötigen Informationen versorgen

Angenommen wird dabei, dass wenige 3D-Objekte hinreichen, um ein technisches System mit allen nötigen Informationen zu versorgen. Bei DeepMind steht die KI jedenfalls bereits definitiv mit dem Menschen in einer Reihe, wenn sie eigenständig ohne Anweisung und Klassifizierung Informationen aus der Umwelt bezieht und sich auf die audiovisuellen Impressionen einen Reim machen kann. Hierzu hat Projektleiter Relja Arandjelović seinen Algorithmus mit 60 Millionen audiovisuellen Eindrücken aus 400'000 Videos gefüttert.

Bedeutet im Klartext, dass die KI umgehend das passende Klatschgeräusch findet, wenn sie ein Foto von klatschenden Händen zu Gesicht bekommt. In Anbetracht der mangelhaft oder überhaupt nicht klassifizierten Daten im Internet wittert Google hier nicht von ungefähr einen Meilenstein des technischen Fortschritts.

Spiele als willkommene Herausforderung

Zu den weltweit beliebtesten Kartenspielen gehört Blackjack. Beinahe jedem ist es ein Begriff, die allerwenigsten vermögen es aber zu spielen. Dabei ist die Sache rasch erklärt. Spieler und Croupier erhalten erst je 2 Karten. In Abhängigkeit der Punktzahl entscheidet sich der Spieler sodann für eine weitere Karte, um möglichst nahe an die 21 heranzukommen oder wenigstens eine höhere Punktzahl als der Croupier zu haben. Schiesst er übers Ziel von 21 hinaus, hat er automatisch verloren. Was auf den ersten Blick recht simpel anmutet, bedarf durchaus der Übung und Erfahrung. Es gebietet die Vernunft, sich bei Online-Casinos über die einschlägigen Strategien schlauzumachen.

Auch wenn mit Blackjack im Allgemeinen die "Hit and Stand"-Strategie assoziiert wird, sich der Spieler also schlicht dazu entscheidet, eine weitere Karte zu ziehen oder nicht, erhöhen sich die Erfolgschancen durch die strategische Vielfalt im Sinne von Surrender, Pair Splitting und Doubling Down. Allerdings besteht ebenso die Möglichkeit, sich der künstlichen Intelligenz des Blackjack-Rechners zu bedienen. Mit ihm ist es ein Leichtes, die richtige strategische Entscheidung zu treffen. Er rät zu Stand, Hit, Split oder Double Down und prognostiziert die Gewinnchance. Sein Erfolgsgeheimnis ist die Strategietabelle, die auf das Jahr 1958 zurückgeht und jedem Blackjack-Spieler bestens vertraut ist.

Dass die künstliche Intelligenz im Spiel zu Hause ist und sich beileibe nicht nur auf Blackjack beschränkt, ist ein offenes Geheimnis. So verlor im Februar 1996 der damalige Schachweltmeister Garri Kasparow in Philadelphia, USA, gegen den IBM-Computer Deep Blue. Angesichts von 10120 möglichen Schachzügen und der Tatsache, dass sich ein Programm wie Giraffe innerhalb von 72 Stunden selbst Schach beibringen kann, überrascht das wenig. Im März 2016 musste sich hingegen der beste Go-Spieler der Welt, der Südkoreaner Lee Sedol, dem Computerprogramm AlphaGo geschlagen geben; immerhin eine von vier Partien konnte er im Kampf "Mensch gegen Computer" jedoch für sie gewinnen.

Im Januar dieses Jahres hatten vier Pokerprofis gegen Libratus keine Chance. Das überrascht denn doch einigermassen, nachdem es sich beim Poker um ein Spiel mit unvollständiger Information handelt, die der künstlichen Intelligenz naturgemäss zu schaffen macht. Die Software kennt die Karten ihres Gegenspielers nicht, während beim Schach oder Go der Gegenspieler ein offenes Buch ist.

Noch vor 2 Jahren gingen die Spieler denn auch aus der Partie Texas Hold’em gegen einen Computer als Sieger hervor. Dank grösserer Rechenleistung und verbesserter Algorithmen ist jedoch im Unterschied zum Vorgänger Claudio bei Libratus mit einem Bluff kein Staat zu machen. Libratus wurden schlicht und einfach die Pokerregeln eingeimpft, ehe sich die Software selbst überlassen wurde. Daraufhin hat sie Milliarden Hände gespielt und gewinnbringende Strategien abgeleitet.

Bewegung neuerdings angesagt

Stand bei AlphaGo erst Go auf dem Programm, verschreibt sich die KI mittlerweile anderen Aufgaben. Bewegung ist nunmehr in. So ist es an den Algorithmen, sich selbst das Laufen beizubringen. Als Protagonist fungiert dabei ein biederes Strichmännchen, das über virtuelles Geröll läuft, Hindernisse umkurvt, aber ebenso gegen eine Wand knallt und filmreif zu Boden geht. Das Strichmännchen wird so lange in den Hindernis-Parcours geschickt, bis es weiss, wo es langgeht und sich auch in unbekanntem virtuellem Terrain zurechtfindet.

Die Methode nennt sich Reinforcement Learning, zu Deutsch bestärkendes Lernen. Ins Unreine gesprochen bekommen hier die KI-Agenten eine Art Belohnungssignal, wenn sie die Aufgabe bravourös meistern. Die Belohnung fördert naturgemäss den Lernprozess. Mithin verhalten sich die KI-Agenten künftig wunschgemäss. Allerdings funktioniert die Sache bloss, wenn die Belohnung klar definiert ist.

Mit der Erhöhung eines Scores bei einem Videospiel hat der KI-Agent keinerlei Probleme, klafft hingegen ein Abgrund vor ihm, versagt die Belohnung nicht selten ihren Dienst. Hier eine manuelle Hilfestellung durch sorgsam ausgewählte Belohnungsfunktionen zu bieten, ist nicht unbedingt im Sinne des Erfinders. Die KI sollte sich vielmehr im Stande sehen, mit einer vergleichsweise simpel gestrickten Belohnungsfunktion zuverlässig zu arbeiten. Anders ausgedrückt: Das Strichmännchen hat tunlichst selbst herauszufinden, was es für den perfekten Hindernisläufer braucht.

Artikelfotos: Twitter