Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ss16:09.06.2016 [2016/06/23 14:43] henrikfrenzel |
ss16:09.06.2016 [2016/06/23 14:52] (aktuell) henrikfrenzel |
||
---|---|---|---|
Zeile 16: | Zeile 16: | ||
def main(k): | def main(k): | ||
daten=mat['data'] | daten=mat['data'] | ||
- | choice= np.random.choice(70000,10000, replace=False) | + | choice=np.random.choice(70000,10000, replace=False) |
test=daten[:,choice].copy() | test=daten[:,choice].copy() | ||
datenkurz=np.delete(daten,choice,axis=1) | datenkurz=np.delete(daten,choice,axis=1) | ||
Zeile 30: | Zeile 30: | ||
main(int(10)) | main(int(10)) | ||
</code> | </code> | ||
- | + | ||
+ | Die Aufteilung des Datensatz in zehntausend Test- und sechzigtausend Vergleichsdaten erfolgt, um zu Überprüfen ob der k-nearest-Neighbor-Algorithmus die richtigen Zahlen zuordnet. Des Weiteren wollen wir wissen für welches k die bestmögliche Genauigkeit erzielt wird. k=10 hatte dabei die optimalste Genauigkeit von den getesteten Zahlen. | ||