GOCR

freie Texterkennungs-Software

GOCR ist eine freie Texterkennungs-Software (OCR) von Jörg Schulenburg, die durch Kommandozeilen-Befehle bedient wird.

GOCR (auch JOCR)
Basisdaten

Entwickler Jörg Schulenburg
Aktuelle Version 0.50
(5. März 2013)
Betriebssystem Linux, Windows, OS/2, Mac OS X
Programmier­sprache C
Kategorie Anwendungsprogramm
Lizenz GPL (Freie Software)
deutschsprachig nein
jocr.sf.net

GOCR erkennt verschiedene Druckerschriftarten, ohne auf eine Datenbank zurückgreifen zu müssen, was die Anwendung besonders einfach macht. Neben reinem Text kann das Programm auch gängige eindimensionale Strichcodes dekodieren.

Verfügbarkeit

Bearbeiten

Das Programm wird als freie Software auch im Quelltext unter den Bedingungen der GNU General Public License (GPL) verbreitet. Ursprünglich erschien das Programm für Linux, mittlerweile sind auch Binärdateien für Windows und OS/2 verfügbar, die von den externen Programmierern Peter B. L. Meijer und Franz Bakan zur Verfügung gestellt werden. Das Programm ist in allen gängigen Linux-Distributionen enthalten.[1][2][3][4] Es dient zum Beispiel Kooka, einer Scannersoftware unter KDE, als Back-end.

Geschichte

Bearbeiten

Die erste Version (0.1) wurde im Herbst 1998 erstellt. Die erste offizielle Veröffentlichung erfolgte mit Version 0.2.1 im März 2000 über Freshmeat. Seit Mitte 2000 ist das Projekt auf SourceForge gehostet.[5] Da bei der Veröffentlichung des Quellcodes auf SourceForge.net festgestellt wurde, dass bereits ein Projekt mit dem Namen GOCR existierte, führte die Projektleitung auch den Namen JOCR für das Programm ein. Um 2000/2001 wurde es in die Linux-Distributionen SuSE und Debian aufgenommen. Bis zur Freigabe von Tesseract im Jahr 2005 (2006?) war es neben Ocrad die beste und gebräuchlichste Texterkennungs-Software aus den Bereichen der freien Software und Linux-Software.

Siehe auch

Bearbeiten
Bearbeiten

Einzelnachweise

Bearbeiten
  1. packages.ubuntu.com
  2. apps.fedoraproject.org
  3. software.opensuse.org
  4. mandriva.org @1@2Vorlage:Toter Link/doc4.mandriva.org (Seite nicht mehr abrufbar, festgestellt im April 2018. Suche in Webarchiven)  Info: Der Link wurde automatisch als defekt markiert. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis.
  5. www-e.uni-magdeburg.de (PDF; 778 kB)