zurück zu: [[Plan]] ===Neue und noch stehende Fragen=== * Wie kann man ein CNN, das auf Zahlenerkennung angelegt ist, auf die Buchstabenerkennung expandieren? * Wie kann man das Bildformat von Datensätzen anpassen, sodass es die gleiche Pixelgröße wie ein anderer bereits angewendeter Datensatz nutzt? (Bsp. 40x40 zu 28x28) * Wie kann man auf ein CNN eingreifen, sodass sich die Fehlerrate verkleinert, wodurch ein effizienteres Programm erstellt werden kann? * Wie kann man Leerzeichen erkennen, bzw. erkennen, dass ein Wort endet? Antwort: Eine Lösung ist eventuell das n-Gram-Modell, das die Wahrscheinlichkeit für jedes mögliche folgende Zeichen berechnet. * Wie erkennen wir in Schreibschrift geschriebene Wörter, bzw. sich überlappende Buchstaben? Und wie schaffen wir es, falsche Lücken zwischen Buchstaben zu ignorieren? * Wie erkennen und begradigen wir kursiv, bzw. schräg geschriebene Buchstaben? * Wie erkennen wir fehlerhaft erkannte Wörter und berichtigen diese? Antwort: Wir könnten jedes Wort mit einer vollständigen Wortliste und der Vorkommenshäufigkeit jeden Wortes abgleichen. Auch hier könnte das n-gram-Modell helfen * Wie erkennen wir das Format und übertragen dieses in den exportierten Text?