Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ss19:offene_fragen [2019/09/05 15:40] jheinlein |
ss19:offene_fragen [2019/09/05 15:51] (aktuell) jheinlein |
||
---|---|---|---|
Zeile 7: | Zeile 7: | ||
Antwort: Bis zu dem Punkt, dass wir den erkannten Text in LaTeX-Code übersetzen, sind wir nicht gekommen. | Antwort: Bis zu dem Punkt, dass wir den erkannten Text in LaTeX-Code übersetzen, sind wir nicht gekommen. | ||
*Funktioniert die Erkennung von Schreibschrift? | *Funktioniert die Erkennung von Schreibschrift? | ||
- | Antwort: Mit diesem Programm scheint es nicht möglich. | + | Antwort: Mit diesem Programm scheint es nicht möglich, da es schwierig ist, die einzelnen Buchstaben als einzelne Zeichen zu erkennen. Zwei Dinge könnten helfen: Eine Anpassung der Bilder des Datensatzes, in dem wir künstliche "Störkrakeleien" um die Zeichen herum streuen, damit das CNN nicht mehr von überlappenden und ineinander verfließenden Zeichen verwirrt wird. Andererseits auch die Einführung eines statistischen Modells (n-Gram) zur Vorhersage von Folgezeichen. |
*Gibt es Probleme dabei, Buchstaben einzeln im Wort zu erkennen, trotz deren Nähe zueinander (und teilweiser Überlappung). | *Gibt es Probleme dabei, Buchstaben einzeln im Wort zu erkennen, trotz deren Nähe zueinander (und teilweiser Überlappung). | ||
Antwort: Ja, ähnlich wie bei der Schreibschrift. | Antwort: Ja, ähnlich wie bei der Schreibschrift. | ||
*Wie werden Leerzeichen, neue Absätze, o. Ä. erkannt? | *Wie werden Leerzeichen, neue Absätze, o. Ä. erkannt? | ||
- | Antwort: Dafür müssen weitere Datensätze eingebaut werden. | + | Antwort: Auch hier müssen weitere Datensätze Modelle, wie das n-Gram-Modell eingebaut werden. |