Benutzer-Werkzeuge

Webseiten-Werkzeuge


ws1819:acrobot

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen gezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
ws1819:acrobot [2019/03/22 22:52]
rhotert
ws1819:acrobot [2019/03/31 15:24] (aktuell)
rhotert
Zeile 12: Zeile 12:
 Die Schwierigkeit liegt bei diesem Environment darin, dass man einen Weg finden muss, dass NN mit den wenigen Erfolgen zu trainieren. (Anfangs kam das Pendel bei 1000 Versuchen ca. 2 mal über die Linie) Die Schwierigkeit liegt bei diesem Environment darin, dass man einen Weg finden muss, dass NN mit den wenigen Erfolgen zu trainieren. (Anfangs kam das Pendel bei 1000 Versuchen ca. 2 mal über die Linie)
  
-Dazu muss man wissen, dass die klassische Künstliche Intelligenz (KI) meist nur durch Belohnungen etwas lernt (die sich durch Zwischenetappen ​erringen ​lassen).+Dazu muss man wissen, dass die klassische Künstliche Intelligenz (KI) meist nur durch Belohnungen etwas lernt (die sich durch Zwischenetappen ​erreichen ​lassen).
  
  
-Zum Vergleich ich habe das Problem mit zwei unterschiedlich starken Neuralen Netzen getestet ​+Zum Vergleich
 +ich habe das Problem mit zwei unterschiedlich starken Neuralen Netzen getestet. Nach mehren hundert Testläufen meinerseits,​ ergab sich, dass die besten Resultate mit dem Einfachsten NN und ca. 22 Episoden erzielt wurden 
 +(Highscore 63).[der vermeintliche Weltrekord liegt bei 42]
  
 +63 heißt hierbei aufschwing Versuche.
  
  
-Der Code zum besten Ergebnis 
-ich lass die Trainingsdaten weg, da ich finde dass es am meisten Spaß macht beim lernen zu zugucken. 
-(wenn man die Seite bearbeitet ist der Code richtig formatiert ich sende ihn gerne via SLACK) ​ 
  
  
-''​import random+Ich lasse die Trainingsdaten weg, da ich finde, dass es am meisten Spaß macht beim Lernen zu zugucken 
 +(wenn man die Seite bearbeitet ist der Code richtig formatiert/ ich sende ihn gerne via SLACK)  
 + 
 + 
 +ZIP des Code: {{:​ws1819:​acrobotzip.rar|}} 
 + 
 +Der Code zum besten Ergebnis 
 + 
 +<code python>​ 
 +import random
 import gym import gym
 import numpy as np import numpy as np
Zeile 156: Zeile 165:
     agent.save("​qlearning_Acrobot_1000versuche"​)     agent.save("​qlearning_Acrobot_1000versuche"​)
  
-#//////////////////////////////////////////////​''​+#//////////////////////////////////////////////​ 
 +</​code>​
  
ws1819/acrobot.1553291567.txt.gz · Zuletzt geändert: 2019/03/22 22:52 von rhotert