Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ss19:neue_fragen [2019/09/05 12:18] jheinlein |
ss19:neue_fragen [2019/09/05 14:53] (aktuell) jheinlein |
||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | zurück zu: [[plan]] | + | zurück zu: [[Plan]] |
- | ===Neue Fragen=== | + | ===Neue und noch stehende Fragen=== |
* Wie kann man ein CNN, das auf Zahlenerkennung angelegt ist, auf die Buchstabenerkennung expandieren? | * Wie kann man ein CNN, das auf Zahlenerkennung angelegt ist, auf die Buchstabenerkennung expandieren? | ||
Zeile 8: | Zeile 8: | ||
* Wie kann man auf ein CNN eingreifen, sodass sich die Fehlerrate verkleinert, wodurch ein effizienteres Programm erstellt werden kann? | * Wie kann man auf ein CNN eingreifen, sodass sich die Fehlerrate verkleinert, wodurch ein effizienteres Programm erstellt werden kann? | ||
+ | |||
+ | * Wie kann man Leerzeichen erkennen, bzw. erkennen, dass ein Wort endet? | ||
+ | Antwort: Eine Lösung ist eventuell das n-Gram-Modell, das die Wahrscheinlichkeit für jedes mögliche folgende Zeichen berechnet. | ||
+ | |||
+ | * Wie erkennen wir in Schreibschrift geschriebene Wörter, bzw. sich überlappende Buchstaben? Und wie schaffen wir es, falsche Lücken zwischen Buchstaben zu ignorieren? | ||
+ | |||
+ | * Wie erkennen und begradigen wir kursiv, bzw. schräg geschriebene Buchstaben? | ||
+ | |||
+ | * Wie erkennen wir fehlerhaft erkannte Wörter und berichtigen diese? | ||
+ | Antwort: Wir könnten jedes Wort mit einer vollständigen Wortliste und der Vorkommenshäufigkeit jeden Wortes abgleichen. Auch hier könnte das n-gram-Modell helfen | ||
+ | |||
+ | * Wie erkennen wir das Format und übertragen dieses in den exportierten Text? |