Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ws1819:protokolle [2018/12/06 17:42] johannakistenbruegge |
ws1819:protokolle [2019/03/20 18:46] (aktuell) rhotert |
||
---|---|---|---|
Zeile 8: | Zeile 8: | ||
-in Machine Learning Kurs eingeschrieben (startet am 10.12) | -in Machine Learning Kurs eingeschrieben (startet am 10.12) | ||
+ | bis woche 6 geschafft | ||
-Buch ausgeliehen (Intro ML) | -Buch ausgeliehen (Intro ML) | ||
Zeile 16: | Zeile 17: | ||
--> Hausaufgabe bis Di: Regression, Cassification researchen | --> Hausaufgabe bis Di: Regression, Cassification researchen | ||
+ | |||
+ | |||
+ | Protokoll zum 13.12.18 | ||
+ | |||
+ | Wir haben versucht die Spiele über Python zu öffnen. Dafür haben wir eine Schleife von Stefan bekommen. Für diese brauchten wir mehrere Pakete, die wir noch nicht hatten und die wir für den Rest des Labors versucht haben zu installieren. | ||
+ | |||
+ | Protokoll zum 20.12.18 | ||
+ | |||
+ | Wir haben es geschafft Space Invaders und andere Atari Spiele über Python zu Spielen. | ||
+ | |||
+ | {{:ws1819:image_atari.png?200|}} | ||
+ | |||
+ | Wir haben die Steuerung bei den Spielen verstanden (über die Zahlentasten, variierend von Computer zu Computer). | ||
+ | |||
+ | Wir haben uns mit dem Convollutional nural network bekanntgemacht, indem wir im Internet dazu recherchiert haben. | ||
+ | |||
+ | |||
+ | Protokoll zum 10.1.2019 | ||
+ | |||
+ | Probleme mit der Installation von keras | ||
+ | |||
+ | Erstes NN Cartpool ballancieren. | ||
+ | |||
+ | {{:ws1819:image.png?200|}} | ||
+ | |||
+ | hier nochmal in Aktion :) | ||
+ | |||
+ | {{:ws1819:cartpole_vid.mp4|}} | ||
+ | |||
+ | Ziel: NN umprogramieren, damit es nicht einen Vektor einliest, sondern ein Bild | ||
+ | |||
+ | Protokoll zum 24.01.2019 | ||
+ | |||
+ | Reinforcement Learning: Acrobot Aufgabe bearbeitet | ||
+ | |||
+ | ursprüngliches netz verändert, muss über Nacht benchmarktest machen zum vergleich | ||
+ | art des speicherns geändert damit die wenigen rewards genutzt werden | ||
+ | |||
+ | |||
+ | {{:ws1819:22cd9351-7153-4f58-9193-24c429b28d94.jpg?200|}} | ||
+ | |||
+ | beispiel bild vom Doppelpendel / Ziel ist das es sich über die Linie schwingt mit Hilfe des Momentum | ||
+ | |||
+ | |||
+ | geschaftt!!!!11!1!!1!! | ||
+ | läuft mit guter fps | ||
+ | schafft mit besserem reward system öfter | ||
+ | |||
+ | {{:ws1819:acrobot_vid.mp4|}} | ||
+ | |||
+ | (das video ist von Gym da Google leider keine Display-Funktion hat, mein Programm hat es natürlich geschafft) | ||
+ | |||
+ | Durch Benchmark artige Tests hat sich herausgestellt das es mit wenigen Episoden am besten läuft (unter 25 nicht wie vorher angenommen 1000+) | ||
+ | auch bemerkenswert je simpler das NN desto besser das Resultat | ||
+ | |||
+ | |||
+ | |||
+ | Nach Vielem hin und her und vorallem pip/conda install hat es endlich funktioniert in der aller letzten regulären Mathesis Stunde :) | ||
+ | |||
+ | |||
+ | {{:ws1819:original.mp4|}} | ||
+ | |||
+ | |||
+ | (code auf anderer Seite) | ||
+ |