[GastForen PrePress allgemein Druckvorstufe, Druck und Weiterverarbeitung Einmalig großes Scanaufkommen -- wer hat eine Idee

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Themen
Beiträge
Moderatoren
Letzter Beitrag

Einmalig großes Scanaufkommen -- wer hat eine Idee

Jabadabadu
Beiträge gesamt: 249

12. Dez 2007, 14:53
Beitrag # 1 von 10
Bewertung:
(3419 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

folgende Vorgaben: ich habe vor mir ein Buch mit 907 Seiten, beidseitig bedruckt mit Text und einzelnen Abbildungen, Maße 15,5 x 23,7 cm.

Aufgabe: Ich brauche eine bearbeitbare Fassung (am besten OCR und Bilder) für eine Neuauflage mit Aktualisierungen, da das Buch noch im letzten Jahrtausend gedruckt worden ist (keine Dateien vorhanden). Ich kann es mit meinem Scanner (HP Scanjet 5590; duplexfähig) natürlich machen, aber vielleicht hat jemand eine Dienstleisteradresse (am besten im PLZ-Bereich D-55 [Mainz/Rheinhessen/Nahegebiet]), der so etwas schnell und preis-wert machen kann. Ich brauche erst einmal eine "Hausnummer", damit ich ein Angebot zum Satz machen kann.

Vielen Dank schon jetzt und
viele Grüße
Jörn
X

Einmalig großes Scanaufkommen -- wer hat eine Idee

christiandigital
Beiträge gesamt: 490

12. Dez 2007, 16:38
Beitrag # 2 von 10
Beitrag ID: #326902
Bewertung:
(3384 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Jörn,
wenn es darum geht die Text zu digitalisieren, die Du dann bearbeiten kannst, würde ich empfehlen das ganze in einem Copyshop machen zu lassen. Sofern die über einen Kopierer verfügen, der auch scannen kann. Derartige Geräte erfassen dies als Scan, die Daten können abgegriffen werden und über eine OCR-Schnittstelle hast Du, was Du willst. Die Kosten dürften auch überschaubar bleiben.


als Antwort auf: [#326882]

Einmalig großes Scanaufkommen -- wer hat eine Idee

strauch
Beiträge gesamt: 170

13. Dez 2007, 10:57
Beitrag # 3 von 10
Beitrag ID: #326983
Bewertung:
(3344 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Im letzten Jahrtausend? Das kann 1999 oder 1850 oder 1120 sein? Ich habe nur mal einen Beitrag gesehen das google Bücher abfotografiert um diese möglichst wenig zu beschädigen. Die Bücher wurden auch nur im 90° Winkel geöffnet. Vielleicht ist auch eine Möglichkeit. 2 Stative. Kamera mit Fernauslöser. Immer eine Seite umblättern. Foto und weiter?


als Antwort auf: [#326882]
(Dieser Beitrag wurde von strauch am 13. Dez 2007, 10:57 geändert)

Einmalig großes Scanaufkommen -- wer hat eine Idee

Thomas Richard
Beiträge gesamt: 19334

13. Dez 2007, 11:25
Beitrag # 4 von 10
Beitrag ID: #326992
Bewertung:
(3328 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ strauch ] IIch habe nur mal einen Beitrag gesehen das google Bücher abfotografiert um diese möglichst wenig zu beschädigen. Die Bücher wurden auch nur im 90° Winkel geöffnet.

Meinst du den Wolfenbüttler Buchspiegel?
http://digitalisierung.image-engineering.de/article.php/Buchspiegel
http://digitalisierung.image-engineering.de/...0IE%20Versionneu.pdf


als Antwort auf: [#326983]

Einmalig großes Scanaufkommen -- wer hat eine Idee

Jabadabadu
Beiträge gesamt: 249

13. Dez 2007, 11:27
Beitrag # 5 von 10
Beitrag ID: #326993
Bewertung:
(3327 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Danke für die beiden Antworten.

Ich muss noch genauer werden: Das Buch ist 1989 erschienen, der Verlag zwischenzeitlich aber nicht mehr existent.

Ich soll nun für eine Neuauflage den Text setzen und dem Autor damit die Möglichkeit geben, Text für eine erweiterte Neuauflage schreiben zu können.

Ich brauche -- ich glaubte, das deutlich gemacht zu haben -- einen kompletten Scan des Buches (907 Seiten; OCR --> RTF), damit der Autor den Text bearbeiten und ich den Text setzen kann.

Ich kann das mit dem HP Scanjet 5590 natürlich machen -- aber: gibt es einen Dienstleister, der dies zufriedenstellend, schneller und des Preises wert (nicht billig, nicht umsonst ;-)) erledigen kann?

Viele Grüße
Jörn


als Antwort auf: [#326983]

Einmalig großes Scanaufkommen -- wer hat eine Idee

Thomas Richard
Beiträge gesamt: 19334

13. Dez 2007, 11:48
Beitrag # 6 von 10
Beitrag ID: #327001
Bewertung:
(3319 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
In dem gegebenen Fall würde ich aber für Auftrennen plädieren und einen Dokumentenscanner am besten mit integrierter PDF und OCR Option empfehlen:
http://www.adavis.de/...scanner---Legal.html

Die Frage ist, ob die Bilder da einfach mitlaufen können oder wirklich einzeln zu machen sind.

Eine Google Suche wirft dich mit Diestleistern tot:
http://www.google.de/...btnG=Suche&meta=


als Antwort auf: [#326993]
(Dieser Beitrag wurde von Thomas Richard am 13. Dez 2007, 11:56 geändert)

Einmalig großes Scanaufkommen -- wer hat eine Idee

christiandigital
Beiträge gesamt: 490

13. Dez 2007, 12:11
Beitrag # 7 von 10
Beitrag ID: #327015
Bewertung:
(3304 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Thomas Richard ] In dem gegebenen Fall würde ich aber für Auftrennen plädieren und einen Dokumentenscanner am besten mit integrierter PDF und OCR Option empfehlen:
http://www.adavis.de/...scanner---Legal.html

Die Frage ist, ob die Bilder da einfach mitlaufen können oder wirklich einzeln zu machen sind.

Eine Google Suche wirft dich mit Diestleistern tot:
http://www.google.de/...btnG=Suche&meta=


Na, meine Rede. Derartige Geräte finden sich im vernünftigen Copyshop. Ob nun Kauf oder nicht, ist ja etwas anderes. Für einen ersten Test würde ich jedoch nichts kaufen.


als Antwort auf: [#327001]

Einmalig großes Scanaufkommen -- wer hat eine Idee

worshipper
Beiträge gesamt: 214

14. Dez 2007, 11:26
Beitrag # 8 von 10
Beitrag ID: #327241
Bewertung:
(3244 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

ich würde versuchen nochmal an die Daten ranzukommen... versuche die Druckerei, den Satzmenschen irgendwenn ausfindig zu machen. Vielleicht hast du ja Glück und es lässt sich etwas auftreiben.

Ansonsten wenn das misslingt, das Buch auf die Einzelseiten auseinandernehmen und mit einem automatischen Scanner durchlaufen lassen. Das geht recht flott....
Du brauchst das ganze als RTF? Dann musst du eine "gute" OCR Software finden, also eine die auch Automatisch nach Fehler durchsucht... am besten verschiedene Demos mal ausprobieren und gucken was ist da am besten.

Tja und am Schluss würde ich einen Studenten anheuern, der das ganze nochmal nach Fehler anhand der Vorlage durchsucht. Die Software kann leider nicht alles.

Wenn du weitere hilfe brauchst -> pn an mich


als Antwort auf: [#327015]

Einmalig großes Scanaufkommen -- wer hat eine Idee

olaflist
Beiträge gesamt: 1400

14. Dez 2007, 14:50
Beitrag # 9 von 10
Beitrag ID: #327272
Bewertung:
(3215 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Der Vorschlag mit dem Copyshop ist hier glaube ich der am ehesten und am kostenguenstigsten zielfuehrende. Zumindest bessere Copyshops haben Maschinen, die es gestatten die Vorlage (idealerweise) als PDF abzulegen, grundsaetzlich kann man bei entsprechenden Maschinen auch gleich das OCR miterledigen lassen.

Ich hatte kuerzlich die OCR-Software von Abbyy zu evaluieren und war ueberrascht, dass (bei halbwegs sauberen Vorlagen) die Fehlerquote sehr nahe bei 0 Prozent lag.

Sollte die Kopier-Scan-Maschine kein OCR eingebaut haben (oder kein gutes), sollte man fuer ueberschaubares Geld Abbyy-Software beschaffen koennen. Wichtig: bei der Software-Konfiguration immer bestmoeglich (nicht schnellstmoeglich) einstellen.

Auch die in Acrobat 8 Pro eingebaute OCR-Funktion ist sehr ordentlich, aberr nicht so fein konfigurierbar wie spezielle OCR-Loesungen.

Ganz wichtig fuer's Scannen: der Scan muss so gut wie moeglich erfolgen, damit es die OCR-Software nicht so schwer hat, also moeglichst plan und sauber scannen, gute Aufloesung (mind. 300 ppi), eher Graustufen als Bitmap. Das bedeutet, dass man das Buch aufschneiden sollte, um es durch die Dokumentenzufuehrung eines entsprechenden Geraetes jagen zu koennen.

Seitenartefakte (Seitenzahl, Lebene Kolumnentitel, etc.) sollten man mit dem Beschneidewerkzeug in Acrobat ausblenden.

Im OCR-Ergebnis (wenn man die PDF-Datei als RTF wegspeichert) wird man allerdings in jedem Fall noch mit so manchem unzutreffendem Zeilenumbruch und uebrig gebliebenem Silbentrennstrich zu tun haben - es bleibt also auf jeden Fall etwas Handarbeit erforderlich. Auf eine evtl. moegliche Textformaterkennung (Schriftart, Fett/Kursiv, Schriftgroesse, etc.) wuerde ich verzichten, bzw. einfach alles einheitlich in der Basis-Formatierung auszeichnen, und dann Ueberschriften etc. nachformatieren. Zu klaerende Fragen: welche Rolle spielen Grafiken, Bilder, Tabellen, u.a.e, sprich: alles was nicht Fliesstext ist - da darf man sich bei einem solchen Scan-/OCR-Prozess eher weniger echte Hilfestellung erwarten (wenn man denn das Ganze spaeter wieder als Druckvoralge braucht).

Am besten naehert man sich dem Thema an, indem man ein paar Seiten probeweise verarbeitet (hier reicht evtl. eine sehr gute Fotokopie einzelner Seiten, dann muss man das Buch nicht gleich zerschneiden).

Da ein Copyshop Auskunft darueber geben koennen sollte. was ein Scan pro Seite kostet, sind auch die Kosten gut abzuschaetzen. Bei einem einmaligen Auftrag fuer ein einzelnes Buch glaube ich nicht, dass spezialisierte Scan-Dienstleister im Preis mithalten koennen - die sind meist an Auftraegen interessiert, wo es um hunderttausende von Seiten geht..

Olaf Druemmer


als Antwort auf: [#327241]

Einmalig großes Scanaufkommen -- wer hat eine Idee

Jabadabadu
Beiträge gesamt: 249

14. Dez 2007, 15:14
Beitrag # 10 von 10
Beitrag ID: #327275
Bewertung:
(3202 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Auch hier denjenigen mit den letzten Hinweisen und Infos herzlichen Dank. Ich werde also demnächst in den Copyshop meines Vertrauens stiefeln und das Buch dort passend zerschneiden (lassen) und als PDF/RTF speichern lassen, damit ich schließlich wieder in Indesign setzen kann. Abbyy ist vorhanden -- dann klappt ja hoffentlich alles.

Viele Grüße
Jörn


als Antwort auf: [#327272]
X