Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ws1819:protokolle [2019/03/20 18:28] rhotert |
ws1819:protokolle [2019/03/20 18:46] (aktuell) rhotert |
||
---|---|---|---|
Zeile 65: | Zeile 65: | ||
schafft mit besserem reward system öfter | schafft mit besserem reward system öfter | ||
+ | {{:ws1819:acrobot_vid.mp4|}} | ||
+ | (das video ist von Gym da Google leider keine Display-Funktion hat, mein Programm hat es natürlich geschafft) | ||
Durch Benchmark artige Tests hat sich herausgestellt das es mit wenigen Episoden am besten läuft (unter 25 nicht wie vorher angenommen 1000+) | Durch Benchmark artige Tests hat sich herausgestellt das es mit wenigen Episoden am besten läuft (unter 25 nicht wie vorher angenommen 1000+) | ||
auch bemerkenswert je simpler das NN desto besser das Resultat | auch bemerkenswert je simpler das NN desto besser das Resultat | ||
+ | |||
+ | |||
+ | |||
+ | Nach Vielem hin und her und vorallem pip/conda install hat es endlich funktioniert in der aller letzten regulären Mathesis Stunde :) | ||
Zeile 75: | Zeile 80: | ||
+ | (code auf anderer Seite) | ||