du erinnerst Dich, das ich PDFs hatte die die keinen Text enthielten, aber dafür Returns und/oder vereinzelte Zeichen. Um diese auch wieder in die OCR Erkennung zu schicken habe ich mir gedacht.
Wenn im TextBlock keine Buchstaben und auch keine Zahlen enthalten sind, dann ......
deshalb > not equal <
Da aber schon mal vereinzelt ein J oder L oder 0 drin sein können, habe ich gedacht, dass man um ein sinnvollen Text zu erhalten ein paar Buchstaben oder zahlen mehr braucht als eins.
Also habe ich mir gedacht eine Abfrage zu erzeugen die besagt:
Wenn im Textblock keine Buchstaben von 3 aufsteigend und auch keine Zahlen von 3 aufsteigend enthalten sind, dann gehe direkt ins OCR Erkennungsverzeichnis und gehe nicht über Los und ziehe keine 4000 Euro ein :)
Viele Grüsse
Michael
(Dieser Beitrag wurde von michael m. am 3. Mär 2011, 19:38 geändert)
falls Du Dich mit "Hallo Hans" an Deinen Vorredner -hans- richtest, dann wird er sich nicht an die PDFs erinnern, welche nur Returns enthalten.
@ -hans- : Bitte mit vollem Vornamen unterzeichnen.
Das mit dem not equal to ist so eine Sache. Das bedeutet nämlich: nicht gleich wie. Und der Einzeiler welcher den String textBlock mit dem Ergebnis aus einem find-text-Grep vergleicht, kann so nicht funktionieren. Weil: textBlock ist ein String und das Grep-Ergebnis eine Liste.
Besser ist der Ansatz von Hans-Gerd. Aber man müsste wissen, was Du (Michael) als Minimal-Inhalt definierst.
Angenommen, in textBlock befinden sich zwei Ziffern und zwei Buchstaben
Das Ergebnis ist {} (eine leere Liste), d.h. beim Zählen kommt eine Null.
Bei drei Ziffern und zwei Buchstaben ist der eine Schwellwert erfüllt
Das Ergebnis ist {"123"} (eineListe mit einem Element). Beim Zählen kommt eine Eins.
du hast vollkommen recht. Wenn ich Dokumente Scanne, dann ist ausser den Bilddateien nichts enthalten. Wenn dann diese Zeichen und/oder nur Returns enthalten ist, dann ist das wohl das Ergebnis einer OCR Erkennung.
Dann nützt es nichts dieses erneut Erkennen zu lassen. Also wird es sofort abgearbeitet und habe dabei Code und hantiererei gespart.
So einfache Fragen können einen wirklich die Augen öffnen.
Vielen Dank
Michael
(Dieser Beitrag wurde von michael m. am 4. Mär 2011, 09:30 geändert)