Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ws1819:protokolle [2019/01/10 17:59] johannakistenbruegge |
ws1819:protokolle [2019/03/20 18:46] (aktuell) rhotert |
||
---|---|---|---|
Zeile 8: | Zeile 8: | ||
-in Machine Learning Kurs eingeschrieben (startet am 10.12) | -in Machine Learning Kurs eingeschrieben (startet am 10.12) | ||
+ | bis woche 6 geschafft | ||
-Buch ausgeliehen (Intro ML) | -Buch ausgeliehen (Intro ML) | ||
Zeile 41: | Zeile 42: | ||
{{:ws1819:image.png?200|}} | {{:ws1819:image.png?200|}} | ||
+ | hier nochmal in Aktion :) | ||
+ | |||
+ | {{:ws1819:cartpole_vid.mp4|}} | ||
Ziel: NN umprogramieren, damit es nicht einen Vektor einliest, sondern ein Bild | Ziel: NN umprogramieren, damit es nicht einen Vektor einliest, sondern ein Bild | ||
+ | Protokoll zum 24.01.2019 | ||
+ | |||
+ | Reinforcement Learning: Acrobot Aufgabe bearbeitet | ||
+ | |||
+ | ursprüngliches netz verändert, muss über Nacht benchmarktest machen zum vergleich | ||
+ | art des speicherns geändert damit die wenigen rewards genutzt werden | ||
+ | |||
+ | |||
+ | {{:ws1819:22cd9351-7153-4f58-9193-24c429b28d94.jpg?200|}} | ||
+ | |||
+ | beispiel bild vom Doppelpendel / Ziel ist das es sich über die Linie schwingt mit Hilfe des Momentum | ||
+ | |||
+ | |||
+ | geschaftt!!!!11!1!!1!! | ||
+ | läuft mit guter fps | ||
+ | schafft mit besserem reward system öfter | ||
+ | |||
+ | {{:ws1819:acrobot_vid.mp4|}} | ||
+ | |||
+ | (das video ist von Gym da Google leider keine Display-Funktion hat, mein Programm hat es natürlich geschafft) | ||
+ | |||
+ | Durch Benchmark artige Tests hat sich herausgestellt das es mit wenigen Episoden am besten läuft (unter 25 nicht wie vorher angenommen 1000+) | ||
+ | auch bemerkenswert je simpler das NN desto besser das Resultat | ||
+ | |||
+ | |||
+ | |||
+ | Nach Vielem hin und her und vorallem pip/conda install hat es endlich funktioniert in der aller letzten regulären Mathesis Stunde :) | ||
+ | |||
+ | |||
+ | {{:ws1819:original.mp4|}} | ||
+ | |||
+ | |||
+ | (code auf anderer Seite) | ||