Ocrad
Ocrad ist eine freie Texterkennungs-Software (OCR) für die Linux-Kommandozeile, die seit 2003 von Antonio Diaz Diaz im Rahmen des GNU-Projekts entwickelt wird.
Ocrad
| |
---|---|
Basisdaten
| |
Maintainer | Antonio Diaz Diaz |
Entwickler | Antonio Diaz Diaz |
Erscheinungsjahr | April 2003[1] |
Aktuelle Version | 0.29[2] (18. Januar 2024) |
Betriebssystem | Unixoid (z. B. Linux, BSD) |
Programmiersprache | C++ |
Lizenz | GPL (Freie Software) |
www.gnu.org/software/ocrad |
Es akzeptiert Rastergrafiken in Netpbm-Formaten (PBM, PGM, PPM) kann neben 8-Bit-kodiertem Text auch in UTF-8 ausgeben und bietet automatische Erkennung der Seitengestaltung. Es ist in C++ geschrieben. Es basiert auf Merkmalserkennung, also der Extraktion von Merkmalen eines Zeichens.
Das Programm wird als Freie Software auch im Quelltext unter den Bedingungen von Version 3 oder höher der GNU General Public License (GPL) verbreitet. Es ist bei den meisten populären Linux-Distributionen direkt aus den Standard-Paketquellen installierbar.[3][4][5]
Es existieren verschiedene Programme, die sich als graphisches Frontend anbieten: Die ehemalige KDE-Scan-Software Kooka oder die Desktop-OCR-Suite OCRFeeder.
Leistung
BearbeitenGegenüber dem ähnlichen GOCR hat es die Seitengestaltungserkennung voraus und steht in dem Ruf, allgemein etwas bessere Ergebnisse zu liefern. Somit war es bis zur Freigabe von Tesseract im Jahr 2005 (2006?) neben GOCR eine der besten und gebräuchlichsten Texterkennungs-Softwares aus den Bereichen der Freien Software und Linux-Software.[6]
Siehe auch
BearbeitenWeblinks
BearbeitenQuellen
Bearbeiten- ↑ Antonio Diaz Diaz: [Savannah-hackers] submission of ocrad - savannah.nongnu.org. 13. April 2003 (englisch, abgerufen am 20. Mai 2024).
- ↑ Antonio Diaz Diaz: GNU Ocrad 0.29 released. 20. Januar 2024 (englisch, abgerufen am 21. Januar 2024).
- ↑ http://packages.ubuntu.com/search?gocr
- ↑ https://apps.fedoraproject.org/packages/ocrad
- ↑ http://software.opensuse.org/search?q=ocrad
- ↑ http://www.linux-magazin.de/Heft-Abo/Ausgaben/2006/12/Abc-Schuetzen/%28offset%29/2