Bauforum-Logo

Offenes Forum Bauingenieurwesen

log in | registrieren

zurück zum Forum
  Mix-Ansicht

Test (Software)

verfasst von Patrick Doelken, 19.06.2009, 15:02 Uhr

Hallo,
ich habe das Programm mal unter WinXP ausgiebig getestet. Anfängliche Skepsis hat sich zum Teil in Staunen entwickelt aber das Programm hat seine Grenzen.

Ich habe mal 3 Verschiedene Dokumente eingescannt und per OCR bearbeiten lassen.

Test 1:
Eine mit Word erstellte Seite in Schriftgröße 48 \"Calibri\":
[image]
Die Texterkennung lieferte folgendes Ergebniss:
[image]

Test 2:
Ein Scann aus einer Fachzeitschrift.
[image]
Die Texterkennung lieferte folgendes Ergebniss:
[image]

Test 3:
Ein Scann einer ausgedrucken Bahnverbindung.
[image]
Die Texterkennung lieferte folgendes Ergebniss:
[image]

Fazit:
Im ersten Test erkannte das Plugin zwar kein \"w\" im Test. Gab es aber in der Textdatei komischerweise wieder. Nachteil ist, dass man im Plugin einen Rahmen um den zu erkennenden Text ziehen muss. Wenn man den Rahmen zu weit links ansetzt generiert das Plugin vor dem Text entsprechend Leerzeichen.
Im 2. Text musste ich (wie auf dem Ergebniss abgebildet) die Absätze einzelnd markieren. Beim erkennen von mehrspaltigem Text hat das Programm seine Schwierigkeiten. Wenn der Rahmen zu nah am Text plaziert wird kommt es schon mal zu Erkennungsfehlern (\"S\" wird zu \"3\" o.ä.)
Im 3. Text hat das Programm dann versagt aufgrund der vielen Linien und Leerzeichen im Text.

Blind sollte man sich auf die Erkennung nicht verlassen und später noch mal nach Schreibfehlern schauen. Der richtige Umgang mit dem Rahmen ist ein wenig kniffelig. Die Leerzeichen am Zeilenanfang nerven etwas. Bei der Erkennung gilt: seriefenlose Schrift führt zu weniger Fehlern ebenso ist die Qualität des Scanns von Bedeutung. Ich dachte eigentlich dass das Programm schon beim Artikel aus der Fachzeitschrift schlapp macht. Ebenfalls erkennt das Programm große Schrift besser. Der Scann von der Zugverbindung konnte ich nur erfassen indem ich jede Zeile einzelnd erfasst habe. Der Editor mit dem erkannten Text gehört zum Plugin und der Text kann direkt abgespeichert werden. Bei mehreren Erfassungen innerhalb eines Dokumentes sollte man den Text in einem 2. Editor zwischenspeichern.

Ich hoffe ich konnte einen Einblick in das Plugin bieten.
MfG Patrick

--
\"Zähmen sollen sich die Menschen, die sich gedankenlos der Wunder der Wissenschaft und Technik bedienen und nicht mehr davon geistig erfaßt haben als die Kuh von der Botanik der Pflanzen, die sie mit Wohlbehagen frißt.\"

Albert Einstein (1879

antworten
 



gesamter Thread:

zurück zum Forum
  Mix-Ansicht
Offenes Forum Bauingenieurwesen | Kontakt | Impressum
8396 Postings in 4006 Threads, 1091 registrierte User, 39 User online (1 reg., 38 Gäste)
powered by my little forum  RSS-Feed  ^
map | new