zurück zu: [[Plan]]

===Neue und noch stehende Fragen===

* Wie kann man ein CNN, das auf Zahlenerkennung angelegt ist, auf die Buchstabenerkennung expandieren?

* Wie kann man das Bildformat von Datensätzen anpassen, sodass es die gleiche Pixelgröße wie ein anderer bereits angewendeter Datensatz nutzt? (Bsp. 40x40 zu 28x28)
 
* Wie kann man auf ein CNN eingreifen, sodass sich die Fehlerrate verkleinert, wodurch ein effizienteres Programm erstellt werden kann?
 
* Wie kann man Leerzeichen erkennen, bzw. erkennen, dass ein Wort endet?
Antwort: Eine Lösung ist eventuell das n-Gram-Modell, das die Wahrscheinlichkeit für jedes mögliche folgende Zeichen berechnet. 

* Wie erkennen wir in Schreibschrift geschriebene Wörter, bzw. sich überlappende Buchstaben? Und wie schaffen wir es, falsche Lücken zwischen Buchstaben zu ignorieren?

* Wie erkennen und begradigen wir kursiv, bzw. schräg geschriebene Buchstaben?

* Wie erkennen wir fehlerhaft erkannte Wörter und berichtigen diese? 
Antwort: Wir könnten jedes Wort mit einer vollständigen Wortliste und der Vorkommenshäufigkeit jeden Wortes abgleichen. Auch hier könnte das n-gram-Modell helfen

* Wie erkennen wir das Format und übertragen dieses in den exportierten Text?