Dies ist eine alte Version des Dokuments!
zurück zu: plan
* Wie kann man ein CNN, das auf Zahlenerkennung angelegt ist, auf die Buchstabenerkennung expandieren?
* Wie kann man das Bildformat von Datensätzen anpassen, sodass es die gleiche Pixelgröße wie ein anderer bereits angewendeter Datensatz nutzt? (Bsp. 40×40 zu 28×28)
* Wie kann man auf ein CNN eingreifen, sodass sich die Fehlerrate verkleinert, wodurch ein effizienteres Programm erstellt werden kann?
* Wie kann man Leerzeichen erkennen, bzw. erkennen, dass ein Wort endet? – Lösung ist eventuell das n-gram-Modell, das die Wahrscheinlichkeit für jedes mögliche folgende Zeichen berechnet.
* Wie erkennen wir in Schreibschrift geschriebene Wörter, bzw. sich überlappende Buchstaben? Und wie schaffen wir es, falsche Lücken zwischen Buchstaben zu ignorieren?
* Wie erkennen und begradigen wir kursiv, bzw. schräg geschriebene Buchstaben?
*