Benutzer-Werkzeuge

Webseiten-Werkzeuge


Seitenleiste

some:05.12.2019

Protokoll

Heute haben wir uns weiter mit den theoretischen Gegenbenheiten von künstlicher Intelligenz im Bezug auf unser Spiel beschäftigt. Dabei haben wir uns vor allem über „Reinforcement Learning“ informiert und einigten uns recht schnell darauf den Gegner mit Q-Learning zu entwickeln. Daraufhin haben wir uns mit der Methode intensiver beschäftigt und auch schon einen ersten Plan mithilfe des Buches von Richard S. Sutton „Reinforcement Learning An Introduction second edition“ (http://www.incompleteideas.net/book/RLbook2018trimmed.pdf)für den Spieler vom Tic-Tac-Toe-Spiel aufgestellt. Reinforcemts Learning funktioniert indem ein „Agent“ auf seine Umgebung reagiert und für seine Handlung belohnt oder bestraft wird. Er handelt entweder zufällig oder in dem Interesse eine Aktion durchzuführen, welche die größte Belohnung gibt. Beide Handlungsmöglichkeiten sind wichtig, da der Agent auch durch schlechte Aktionen dazulernt. Um den Computer dazu zu bringen so zu lernen, werden wir es mit der q-Formel versuchen, welche anhand seiner Aktionen die Bewertung für die Aktionen, die anfangs noch sehr ungenau sind, spezialisiert. In den nächsten Stunden werden wir uns dann damit beschäftigen wie man das auch in die Tat umsetzen kann.

Vorheriger Termin: 28.11.2019
Nächster Termin: 19.12.2019

some/05.12.2019.txt · Zuletzt geändert: 2020/03/27 16:49 von benbaute