Skip to end of metadata
Go to start of metadata

Ausgangslage

Im Jahr 2017 initiierte die Firma Zühlke einen Wettbewerb, bei dem die Teilnehmer eigene Schieber Jass Bots entwickeln und gegeneinander antreten lassen konnten. Der Gewinner Bot dieses Wettbewerbs musste am Ende gegen ein Team von menschlichen Spielern bestehen. Da diese aber triumphierten, hat die Hochschule für Technik in Rapperswil beschlossen weiter an der Entwicklung von Jass Bots zu arbeiten. Dieser Forschungsarbeit entsprangen bisher zwei weitere Jass Bots, welche auf reinen Deep Learning Ansätzen basierten. Keinem der beiden Bots ist es aber gelungen den Gewinner Bot des Jass Wettbewerbs zu besiegen. Im Rahmen dieser Arbeit soll untersucht werden, inwiefern sich spieltheoretische Ansätze für den Schieber Jass eigenen und ob sich damit ein Bot entwickelt lässt, welcher den Gewinner Bot des Wettbewerbs schlagen kann.

Vorgehen

In einer ersten Phase wurden vielversprechende Lösungsansätze aus der Spieltheorie identifiziert und der Schieber Jass im Detail analysiert. In einer zweiten Phase ist für jeden der Ansätze ein Jass Bot entwickelt worden. Insgesamt sind im Laufe der Arbeit drei Bots entstanden. Der erste Bot arbeitet mit Counter Factual Regret Minimization, kann aber aufgrund der Komplexität des Spiels nur in den beiden letzten Spielzügen eine Entscheidung treffen. Der zweite Bot stellt eine Erweiterung des ersten Ansatzes um eine Monte Carlo Komponente dar und ermöglicht dem Bot dadurch ein ganzes Spiel zu bestreiten. Der dritte Bot arbeitet mit einer Monte Carlo Tree Search, um den bestmöglichen Zug zu finden und kann ebenfalls in jeder Spielsituation Entscheidungen treffen. Damit die Bots verglichen werden können, wurde zudem eine Art virtueller Prüfstand entwickelt. Mit Hilfe dieses Prüfstands konnten in einer dritten Phase Experimente durchgeführt und die Resultate statistisch ausgewertet werden.

Ergebnis

Die Resultate der Experimente zeigen, dass durch den Counter Factual Regret Minimization Algorithmus bereits eine kleine Verbesserung erreicht wurde. Die Monte Carlo Variante des Ansatzes konnte aber nicht die gewünschten Ergebnisse liefern und schnitt schlechter ab als der Gewinner Bot des Wettbewerbs. Die besten Resultate lieferte mit Abstand der Monte Carlo Tree Search Algorithmus. Mit Hilfe dieses Ansatzes konnte ein Bot entwickelt werden, welcher signifikant besser spielt. Ob der Bot allerdings auch gegen menschliche Spieler gewinnt, konnte im Rahmen dieser Arbeit nicht abschliessend geklärt werden. Stichproben haben jedoch gezeigt, dass Spiele gegen den Bot zumindest unterhaltsam sind.

  • No labels