[GastForen Diverses Was sonst nirgends rein passt... OCR mit Mac (Version 10.9.5)

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Themen
Beiträge
Moderatoren
Letzter Beitrag

OCR mit Mac (Version 10.9.5)

nke
Beiträge gesamt: 411

12. Dez 2020, 17:15
Beitrag # 1 von 7
Bewertung:
(86492 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Guten Tag,
ich habe rund 100 Seiten im Format A4 gescannt, als jpg gespeichert. Darauf ist Text, der in tabellarischer Form (ohne Linien in Deutsch, Englisch, Französisch) angeordnet ist.

Den Text muss ich editierbar machen, ich verwende dazu Photoshop, speichere als PDF und lasse dort den Text erkennen. Das geht, aber ich bin doch recht langsam damit.

Gibt es eine Software, die das eleganter macht?
(ich hatte früher unter Windows Omnipage und Finereader, dort konnte ich eine Zone markieren und als Tabelle definieren, das ist aber lange her ...)

Besten Dank und schöne Grüße
Norbert (ID CS5.5, PS CS 5.1)
X

OCR mit Mac (Version 10.9.5)

Polylux
Beiträge gesamt: 1774

12. Dez 2020, 18:15
Beitrag # 2 von 7
Beitrag ID: #577939
Bewertung:
(86477 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Norbert,
Du kannst mit Acrobat alle JPEGs in einen Rutsch in ein PDF erstellen.
Und auf dieses eine PDF kannst Du dann die OCR-Funktion anwerfen.
Im Menü Datei, PDF-Erstellen, aus mehreren Dateien.
Reicht das?
Viele Grüße


als Antwort auf: [#577937]

OCR mit Mac (Version 10.9.5)

nke
Beiträge gesamt: 411

12. Dez 2020, 21:19
Beitrag # 3 von 7
Beitrag ID: #577940
Bewertung:
(86446 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Thomas,
vielen Dank, ja, das hilft weiter.
Allerdings sind alle jpg-Dateien in einem Ordner und nur jede zweite Datei enthält Text (die anderen die dazu gehörenden Bilder). Ich muss das mal testen.
Geht es denn auch mit meiner alten Software?
Schöne Grüße
Norbert


als Antwort auf: [#577939]

OCR mit Mac (Version 10.9.5)

nke
Beiträge gesamt: 411

12. Dez 2020, 21:26
Beitrag # 4 von 7
Beitrag ID: #577941
Bewertung:
(86436 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Nachtrag:
die französischen Texte müssen als solche umgewandelt werden, sonst muss ich alle Accents manuell einfügen, seufz ...


als Antwort auf: [#577940]

OCR mit Mac (Version 10.9.5)

Henry
Beiträge gesamt: 967

13. Dez 2020, 09:23
Beitrag # 5 von 7
Beitrag ID: #577943
Bewertung:
(86338 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf: ...Gibt es eine Software, die das eleganter macht?
(ich hatte früher unter Windows Omnipage und Finereader, dort konnte ich eine Zone markieren und als Tabelle definieren, das ist aber lange her ...)

Ist bei mir zwar auch schon länger her, aber Finereader erkennt ziemlich gut das Layout, wenn das nicht kreuz+quer angelegt ist, auch Tabellen, vollautomatisch. Man kann sich nach der OCR z.B. auch ein Word-Doc mit Beibehaltung des Ursprungslayouts abspeichern.

Mehrere Sprachen hatte ich nie, da soll Finereader recht langsam werden - aber bei nur drei Sprachen, Einzelseiten-JPGs und heutiger Rechenpower, sollte das kein Problem sein?!


als Antwort auf: [#577937]

OCR mit Mac (Version 10.9.5)

nke
Beiträge gesamt: 411

13. Dez 2020, 17:25
Beitrag # 6 von 7
Beitrag ID: #577950
Bewertung:
(86261 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
danke für den Hinweis,
damit habe ich vor vielen Jahren mal erfolgreich Fraktur mit OCr umgewandelt.

Die Angebote sind etwas verwirrend: Versionsnummern von 5 bis 14, was wäre denn die richtige?

Besten Dank und schöne Grüße
Norbert


als Antwort auf: [#577943]

OCR mit Mac (Version 10.9.5)

Henry
Beiträge gesamt: 967

14. Dez 2020, 12:47
Beitrag # 7 von 7
Beitrag ID: #577958
Bewertung:
(86113 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Dafür bin ich zulange raus. Ich schätze zu Win_XP Zeiten, d.h. also Version 8, da dürfte OCR allgemein schon recht ausgereift gewesen sein.
Aktuelle (Test)Version ist wohl die 15?

Was bei den Scanvorlagen wichtig war, dass Punkte, Kommas und Fliegendreck zu unterscheiden waren, ansonsten war mühseliges Nacharbeiten nötig.


als Antwort auf: [#577950]
X