Handschrifterkennung

Form der Mustererkennung

Handschrifterkennung ist eine Form der Mustererkennung, bei der handschriftlich geschriebene Zeichen oder Wörter erkannt werden sollen. Dabei werden unterschieden:[1][2]

  • Online-Handschrifterkennung (z. B. mit einem aktiven Eingabestift): die Information, wie ein Wort geschrieben wurde, also in welcher Reihenfolge die Striche gezogen wurden, kann zur Erkennung benutzt werden
  • Offline-Handschrifterkennung (meist auf Papier oder eingescannt): nur das Endprodukt liegt als Bild vor, es gibt keine Information über die Entstehungs-Reihenfolge.

Daher ist die Offline-Handschrifterkennung ein Teilgebiet der Texterkennung, die Online-Handschrifterkennung jedoch nicht.

Allgemeine Funktionsweise

Bearbeiten

Ein Handschrifterkenner kann verschiedene Schritte zur Schrifterkennung nutzen:

  • Vorverarbeitung: Das Entfernen von überflüssigen (zu hohe Auflösung) oder sogar fehlerhaften Informationen (Bildfehler)
  • Segmentierung: Das Zerlegen der Eingabe in kleinere Teile, wie z. B. das Zerlegen von Wörtern in Buchstaben oder von Zahlen in Ziffern
  • Feature-Extraktion bzw. Generierung: Aus den vielen kleinen Informationen werden weniger, dafür jedoch wichtigere Informationen generiert. So kann in der online-Handschrifterkennung aus den vielen Informationen, wo zu welchem Zeitpunkt der Stift war, die Information generiert werden, welche Krümmung die Schriftkurve in verschiedenen Punkten hat.

In einem weiteren Schritt werden dann mit Techniken des maschinellen Lernens die Zeichen erkannt. Dieser Schritt kann z. B. auch fehlende oder falsche Zeichen und Zeichenreihenfolgen in den Zeichen in der Schreibweise erkennen, z. B. „Schrebweise“, „Schriebweise“ oder „Schreipweise“ (siehe auch N-Gramm angewendet auf einzelne Zeichenketten).

Entwicklungsgeschichte

Bearbeiten

Eines der ersten Handschrifterkennungsverfahren, LeNet, entwickelt von Yann LeCun,[3] entstand parallel zur Entwicklung einer der ersten Convolutional Neural Networks und diente ursprünglich der Erkennung von Postleitzahlen durch den US Postal Service.

Wegen seiner Einschränkung bei der Anzahl von Output-Variablen wurde es jedoch rasch von neueren CNNs abgelöst, wie z. B. von AlexNet.[4]

Online Handschrifterkennung

Bearbeiten

Online-Handschrifterkennung benötigt bereits beim Schreiben einen Touchbildschirm oder ein anderes digitales Gerät zum Aufzeichnen der Schrift. Dabei können verschiedene Eingabegeräte wie Smartphones und Tablets mit Fingern bzw. Eingabestiften oder auch Grafiktabletts eingesetzt werden. Sie liefern die Information, wo sich der Eingabestift befindet. Manche Geräte liefern diese Information auch dann, wenn sich der Stift nicht auf dem Touchscreen befindet, sondern nur darüber ist.

Je nach verwendeter Technologie wird zusätzlich zu den  -Koordinaten der Eingabe auch noch die Information geliefert, wie viel Druck ausgeübt wurde.

Online-Handschrifterkennung ist momentan noch deutlich weniger verbreitet als Offline-Handschrifterkennung.

Online-Handschrifterkennung wird seit den 1950er Jahren wissenschaftlich untersucht.[5] (1958 wurde mit dem „Stylator“ das erste Gerät vorgestellt, mit dem die Aufnahme von On-line-Informationen bzgl. der Handschrifterkennung möglich war.[6])

Die Vorverarbeitung in der Online-Handschrifterkennung kann viele verschiedene Schritte beinhalten:[7]

  • das Finden und Eliminieren „wilder Punkte“, also von Punkten, die durch Hardwarefehler entstehen.
  • das Interpolieren der gemessenen Punkte sowie damit verbunden das Neuberechnen von Punkten.
  • das Skalieren und Verschieben der Eingabe.
  • das Finden einer Basislinie und gegebenenfalls das Korrigieren der Schrift, sodass sie auf einer geraden Basislinie liegt.
  • das Finden und gegebenenfalls das Korrigieren der Neigung der Buchstaben.

Offline-Handschrifterkennung

Bearbeiten

Die Offline-Handschrifterkennung hat zahlreiche Anwendungsgebiete wie die Schrifterkennung auf Formularen, Überweisungsbelegen und Adressen auf Briefen.

Forschung

Bearbeiten

Die Handschrifterkennung hat eine aktive Gemeinschaft, welche diese studiert. Es gibt verschiedene Konferenzen wie die ICFHR oder die ICDAR, welche dieser dienen.

Siehe auch

Bearbeiten

Einzelnachweise

Bearbeiten
  1. Brakensiek, A. and Kosmala, A. and Willett, D. and Rigoll, G.: Vergleich verschiedener statistischer Modellierungsverfahren für die On- und OffLine Handschrifterkennung. 1. Auflage. Springer Berlin Heidelberg, Berlin 1999, ISBN 978-3-540-66381-2, S. 70–77.
  2. Joachim Schenk, Gerhard Rigoll: Mensch-Maschine-Kommunikation. 1. Auflage. Springer Berlin Heidelberg, Berlin 2010, ISBN 978-3-642-05456-3, S. 151–164.
  3. Yann Lecun, Léon Bottou, Yoshua Bengio, Patrick Haffner: Gradient-based learning applied to document recognition (= IEEE [Hrsg.]: Proceedings of the IEEE. Band 86, Nr. 11). 1998, S. 2278–2324, doi:10.1109/5.726791 (englisch, hal.science [PDF; 960 kB; abgerufen am 7. Juni 2024] alternativ online).
  4. Jerry Wei: AlexNet: The Architecture that Challenged CNNs. In: towardsdatascience.com. Towards Data Science, 3. Juli 2019, abgerufen am 6. Juni 2024 (englisch).
  5. Tappert, C. C. and Suen, C. Y. and Wakahara, T.: The State of the Art in Online Handwriting Recognition. In: IEEE Trans. Pattern Anal. Mach. Intell. Band 12, Nr. 8, 1990, S. 787–808, doi:10.1109/34.57669 (englisch).
  6. T. L. Dimond: Devices for Reading Handwritten Characters. In: Papers and Discussions Presented at the December 9–13, 1957, Eastern Joint Computer Conference: Computers with Deadlines to Meet. 1958, S. 232–237, doi:10.1145/1457720.1457765 (englisch).
  7. Martin Thoma: On-line Recognition of Handwritten Mathematical Symbols. Bachelor’s Thesis. Hrsg.: Department of Informatics, Institute for Anthropomatics and Robotics – IAR, Karlsruhe Institute of Technology – KIT; School of Computer Science, Interactive Systems Lab – ISL, Carnegie Mellon University – CMU. 29. November 2015, doi:10.5445/IR/1000048047, arxiv:1511.09030 (englisch, arxiv.org [PDF; 3,2 MB] alternativ online oder hier).