Test (Software)

Patrick Doelken, Fri, 19.06.2009, 15:02 (vor 5397 Tagen) @ Martin Vogel

Hallo,
ich habe das Programm mal unter WinXP ausgiebig getestet. Anfängliche Skepsis hat sich zum Teil in Staunen entwickelt aber das Programm hat seine Grenzen.

Ich habe mal 3 Verschiedene Dokumente eingescannt und per OCR bearbeiten lassen.

Test 1:
Eine mit Word erstellte Seite in Schriftgröße 48 "Calibri":
[image]
Die Texterkennung lieferte folgendes Ergebniss:
[image]

Test 2:
Ein Scann aus einer Fachzeitschrift.
[image]
Die Texterkennung lieferte folgendes Ergebniss:
[image]

Test 3:
Ein Scann einer ausgedrucken Bahnverbindung.
[image]
Die Texterkennung lieferte folgendes Ergebniss:
[image]

Fazit:
Im ersten Test erkannte das Plugin zwar kein "w" im Test. Gab es aber in der Textdatei komischerweise wieder. Nachteil ist, dass man im Plugin einen Rahmen um den zu erkennenden Text ziehen muss. Wenn man den Rahmen zu weit links ansetzt generiert das Plugin vor dem Text entsprechend Leerzeichen.
Im 2. Text musste ich (wie auf dem Ergebniss abgebildet) die Absätze einzelnd markieren. Beim erkennen von mehrspaltigem Text hat das Programm seine Schwierigkeiten. Wenn der Rahmen zu nah am Text plaziert wird kommt es schon mal zu Erkennungsfehlern ("S" wird zu "3" o.ä.)
Im 3. Text hat das Programm dann versagt aufgrund der vielen Linien und Leerzeichen im Text.

Blind sollte man sich auf die Erkennung nicht verlassen und später noch mal nach Schreibfehlern schauen. Der richtige Umgang mit dem Rahmen ist ein wenig kniffelig. Die Leerzeichen am Zeilenanfang nerven etwas. Bei der Erkennung gilt: seriefenlose Schrift führt zu weniger Fehlern ebenso ist die Qualität des Scanns von Bedeutung. Ich dachte eigentlich dass das Programm schon beim Artikel aus der Fachzeitschrift schlapp macht. Ebenfalls erkennt das Programm große Schrift besser. Der Scann von der Zugverbindung konnte ich nur erfassen indem ich jede Zeile einzelnd erfasst habe. Der Editor mit dem erkannten Text gehört zum Plugin und der Text kann direkt abgespeichert werden. Bei mehreren Erfassungen innerhalb eines Dokumentes sollte man den Text in einem 2. Editor zwischenspeichern.

Ich hoffe ich konnte einen Einblick in das Plugin bieten.
MfG Patrick


gesamter Thread:

 RSS-Feed dieser Diskussion

powered by my little forum