OCR-Texterkennungsprogramme im Test: Transym, OmniPage und FineReader überzeugen im DMS-Zusammenspiel mit Office Manager

  • Pressemitteilung der Firma Softwarebüro Krekeler, 16.08.2011
Pressemitteilung vom: 16.08.2011 von der Firma Softwarebüro Krekeler aus Königs Wusterhausen

Kurzfassung: Königs Wusterhausen – Wollen Unternehmen gescannte Dokumente in ein Archivsystem übernehmen und dort verarbeiten oder per Volltextsuche schnell wiederauffinden können, ist neben einer Dokumenten-Management-Lösung (DMS) auch ein ...

[Softwarebüro Krekeler - 16.08.2011] OCR-Texterkennungsprogramme im Test: Transym, OmniPage und FineReader überzeugen im DMS-Zusammenspiel mit Office Manager


Königs Wusterhausen – Wollen Unternehmen gescannte Dokumente in ein Archivsystem übernehmen und dort verarbeiten oder per Volltextsuche schnell wiederauffinden können, ist neben einer Dokumenten-Management-Lösung (DMS) auch ein Texterkennungsprogramm erforderlich. Denn Papier-Dokumente liegen nach ihrer digitalen Erfassung per Scan lediglich als Bilddatei vor. Damit die einzelnen Zeichen aus dem Bildmuster ausgelesen werden können, greifen entsprechende Programme auf die intelligente Optical Character Recognition (OCR)-Technologie zurück. Mit ihr sind die OCR-Texterkennungslösungen in der Lage einzelne Zeichen im Bildmuster zu Wörtern zusammenzufassen und diese mit Wörterbüchern abzugleichen, um bei Falscherkennung automatische Korrekturen durchzuführen.

Doch bei der Erkennungsquote trennt sich die Spreu vom Weizen, wie ein aktueller Test der DMS-Spezialisten vom Softwarebüro Krekeler offenbart. Sie stellten die OCR-Texterkennungsprogramme Nuance OmniPage (Versionen 17.1 und 18.0), ABBYY FineReader for ScanSnap 4.1, Microsoft Office Document Imaging 2003, Transym 3.0 und die Open-Source-Lösung Tesseract 3.0 im Zusammenspiel mit ihrer etablierten Archivierungssoftware Office Manager (www.officemanager.de) auf den Prüfstand. Letztere verfügt über entsprechende Schnittstellen für die Ankopplung der OCR-Programme.

'Zunächst haben wir die Lösungen an einem einfachen Dokument – mit sauberem, schwarzem Druck auf weißem Hintergrund – angewandt. Das zweite Testdokument war da schon anspruchsvoller: Die auf der Rückseite eines Kontoauszuges gedruckten AGB eines Kreditinstitutes mit vorhandenen Flecken und besonders kleiner Schrift. Die aufgetretenen Fehler wurden festgehalten und die Erkennungsquote ermittelt', erläutert Harald Krekeler, Inhaber des Softwarebüro Krekeler, den Testablauf. Während sich alle OCR-Textprogramme beim ersten Testdokument nahezu gleich gut schlugen, offenbarte das zweite bei den Lösungen zum Teil deutliche Unterschiede hinsichtlich der Erkennungsquote und der Fehlerzahl.

Mit einer Erkennungsquote von 99,0 Prozent schnitt Transym beim Vergleichstest am besten ab und holte sich damit den Testsieg. OmniPage sowie der FineReader belegten mit 98,7 Prozent beziehungsweise 98,3 Prozent den zweiten und dritten Platz. Mit merklichem Abstand verfehlten hingegen Microsoft Office Document Imaging (95,3 %) sowie die einzige Open-Source-Lösung im Test – Tesseract (92,9 %) – das Siegerpodest. 'Das hervorragende Ergebnis von Transym hat uns überrascht, während die Erkennungsquoten von OmniPage und FineReader den Erwartungen entsprachen. Das schlechte Abschneiden von Tesseract hingegen liegt darin, dass die Lösung nur auf die reine Zeichenerkennung, jedoch dabei von Hause aus nicht auf ein Wörterbuch zur Plausibilitätsprüfung zurückgreift', resümiert Harald Krekeler.

Weitere Informationen zum OCR-Text finden sich unter http://www.officemanager.de/support/ocr/ocr-test.html


Über das Softwarebüro Krekeler
Das Softwarebüro Krekeler beschäftigt sich seit 1996 intensiv mit dem Thema Dokumentenmanagement und -archivierung und hat sich auf die Entwicklung entsprechender Business-Lösungen spezialisiert. Auf der ITK-Fachmesse CeBIT wurde 1997 erstmals die DMS-Lösung 'Office Manager" vorgestellt.

Das Prinzip der Lösung war und ist denkbar einfach: Papierdokumente werden gescannt, mittels der Volltextindizierung erfasst und mit beliebig vielen Attributen katalogisiert. Gemeinsam mit elektronischen Dokumenten nahezu jeden Formates gelangen sie in ein zentrales Datenverzeichnis. Aus diesem lassen sich die Dokumente mit Hilfe der zugeordneten Attribute und der Volltextsuche mitarbeiterübergreifend abrufen, übersichtlich auflisten und verarbeiten.

Das über Jahre fortgeführte und optimierte Ergebnis, der heutige 'Office Manager', ist inzwischen auch als leistungsfähige Version 'Office Manager Enterprise' für große Unternehmensnetzwerke sowie neben deutscher auch in englischer und polnischer Sprache erhältlich.

Internet: www.krekeler.de




Über Softwarebüro Krekeler:
Weitere Informationen finden sich auf unserer Homepage

Firmenkontakt:
Presse-Kontakt:
Softwarebüro Krekeler
Lösungen für Dokumentenmanagement
Friedrich-Engels-Str. 45
D-15712 Königs Wusterhausen

PresseDesk
Tel: 030 / 2009 513 – 0
E-Mail: softwarebuero-krekeler@pressedesk.de

Die Pressemeldung "OCR-Texterkennungsprogramme im Test: Transym, OmniPage und FineReader überzeugen im DMS-Zusammenspiel mit Office Manager" unterliegt dem Urheberrecht der pressrelations GmbH. Jegliche Verwendung dieses Textes, auch auszugsweise, erfordert die vorherige schriftliche Erlaubnis des Autors. Autor der Pressemeldung "OCR-Texterkennungsprogramme im Test: Transym, OmniPage und FineReader überzeugen im DMS-Zusammenspiel mit Office Manager" ist Softwarebüro Krekeler.