[GastForen PrePress allgemein PDF in der Druckvorstufe Vergleich und Aussortierung gleicher PDF-Inhalte

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Themen
Beiträge
Moderatoren
Letzter Beitrag

Vergleich und Aussortierung gleicher PDF-Inhalte

snowpixel
Beiträge gesamt: 94

22. Jun 2017, 14:11
Beitrag # 1 von 13
Bewertung:
(3549 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo verehrte Forenprofis!

Ich versuche mich kurz zu fassen.
Bei laufenden Katalogproduktionen kommt es hin und wieder mal vor, dass erzeugte DruckPDFs versehentlich gleichen Seiteninhalt bei unterschiedlichen Dokument-Benamungen haben. D.h.
z.B.
Dokument ABC_002_003 mit Seiteninhalt Modestrecke
Dokument XYZ_004_005 aber gleicher Inhalt wie ABC

Das kommt vor, wenn verschiedene Mitarbeiter den gleichen Bogen bearbeiten und bei der PDF-Ausgabe nicht auf die korrekte Benamung achten.

Die Druckerei richtet sich nach den PDF-Benamungen und so könnte der Fall eintreten, dass im Katalog identische Seiten gedruckt werden. Bisher ist das zum Glück im Vorfeld entdeckt worden, aber bei einigen tausend Seiten kann das doch irgendwann mal durchrutschen.

Nun sind wir auf der Suche nach einer geeigneten Software, die die Seiteninhalte vergleicht und ungewünschte Dubletten herausfiltert. Leider sind wir nicht wirklich fündig geworden, da z.B. Gemini u.ä. nur wirklich komplett identische Dokumente findet, so dass schon eine uneinheitliche Uhrzeitangabe in der Kopfzeile dazu führt, gleichinhaltliche PDFs als NICHT identisch zu definieren.
Wünschenswert wäre eine Lösung die den gesamten Auslieferungsordner im Stapel nach diesen potentiellen Fehlerquellen durchforstet und etwaige Vorkommen aussortiert.

Vielleicht gibt es ja bei Euch ähnlich gelagerte Problemfälle und evtl. auch eine Lösung hierzu.

Vielen Dank schon mal vorab!
Sonnige Grüße aus München!
X

Vergleich und Aussortierung gleicher PDF-Inhalte

Thomas Richard
Beiträge gesamt: 17814

22. Jun 2017, 14:38
Beitrag # 2 von 13
Beitrag ID: #558186
Bewertung:
(3543 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Deinen eigentlichen Ansatz halte ich für nahezu unmöglich realisierbar? Ab welcher Differenz (Noch schnell ein Bild an die Richtige Stelle geschoben, einen Tippfehler korrigiert, ...?), soll da agiert werden? Gerade wenn mehrere im Team arbeiten kann ja auch mal 5 Minuten später die gleiche Datei mit einer aktuelleren Version eines Bildes entstehen. Soll sowas gefunden werden, wenn ja ab welcher Veränderung,, muss sie im sichtbaren Auschnitt leigen, oder sind die veränderten Pixel vllt, eh nur auf der anderen Hälfte der Doppelseite zu sehen, ...?

Antwort auf: Das kommt vor, wenn verschiedene Mitarbeiter den gleichen Bogen bearbeiten und bei der PDF-Ausgabe nicht auf die korrekte Benamung achten.

Dann würde ich da ansetzen und Die Benamung automatisieren, sprich der PDF Name wird per Script aus dem Inhalt und einer eindeutigen Kennung erzeugt. Dann kann schonmal kein falscher Name mehr auftauchen, und es wären nur noch die Versionen
ABC_002_003 14:37:27
und die
ABC_002_003 14:38:15
abzugleichen.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/


als Antwort auf: [#558184]

Vergleich und Aussortierung gleicher PDF-Inhalte

Thomas Richard
Beiträge gesamt: 17814

22. Jun 2017, 14:41
Beitrag # 3 von 13
Beitrag ID: #558187
Bewertung:
(3541 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
###nachtrag: Was evtl ginge, wäre den Dokumentnamen und die Pagina, und was sonst noch als Alleinstellungsmerkmal eines PDFs in Frage kommt, in die Metas des PDFs zu schreiben und unter OS X eine Spotlightsuche auf identische Metas loszujagen. Sollte in jedem Fall effizienter sein, als tatsächlich alle PDFs aufs letzte Byte abzusuchen.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/


als Antwort auf: [#558186]

Vergleich und Aussortierung gleicher PDF-Inhalte

snowpixel
Beiträge gesamt: 94

22. Jun 2017, 15:05
Beitrag # 4 von 13
Beitrag ID: #558189
Bewertung:
(3533 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
hallo Thomas,

danke für die schnelle Antwort…!
Deinen Ansatz kann ich verstehen, setzt aber auch voraus, dass die "richtigen" Seiten auch "richtig" benannt werden. Da aber versehentlich "richtige" Seiten falsch benamt wurden, wird mir die Suche nach Metadaten (die ja dann folglich auch nicht richtig sind) kein Ergebnis liefern.
Die PDFs müssten eigentlich nach "Bildinhalten" abgegrast werden und wenn ABC.pdf und XYZ.pdf das gleiche Seitenlayout beinhalten, dann sollte ein, wie-auch-immer-Workflow, Alarm schlagen.
Da die Katalogproduktion noch very old school in XPress 6.5 erstellt wird (man traut sich´s gar nicht sagen) ist die Übernahme des Namen vom Quelldokument nicht immer konstant zuverlässig und wird z.Teil noch händisch eingetragen… Das macht´s dann auch so gefährlich.

Grüße,
Olaf


als Antwort auf: [#558187]

Vergleich und Aussortierung gleicher PDF-Inhalte

snowpixel
Beiträge gesamt: 94

22. Jun 2017, 15:15
Beitrag # 5 von 13
Beitrag ID: #558190
Bewertung:
(3527 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
###auch noch ein Nachtrag.
Hab das mit der Pagina in den Metadaten erst jetzt verstanden…sorry…
Wie bekommt man das sauber und möglichst geschmeidig hin, da ja leider jeder zuzügliche Step im Worklflow zeitlich problematisch werden kann…
Danke!


als Antwort auf: [#558189]

Vergleich und Aussortierung gleicher PDF-Inhalte

Thomas Richard
Beiträge gesamt: 17814

22. Jun 2017, 15:39
Beitrag # 6 von 13
Beitrag ID: #558191
Bewertung:
(3524 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Werden die PDFs gedruckt oder exportiert?

Hier laufen diverse Heliosworkflows die mit den Imageservermöglichkeiten die Seitennummern und Dokumetnamen zugeteilt bekommen.

Ansonsten mal nach Helferlein wie OutputFactory oder Callas’ made to print googeln.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/


als Antwort auf: [#558190]

Vergleich und Aussortierung gleicher PDF-Inhalte

snowpixel
Beiträge gesamt: 94

22. Jun 2017, 15:59
Beitrag # 7 von 13
Beitrag ID: #558192
Bewertung:
(3519 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
…die PDFs werden exportiert. Leider ist es auch so, dass die Quelldokumente im Seitenlayout nicht nach Paginas angelegt sind. Heisst halt dann Musterseite A 1 und ist letztendlich eine Seite im Doppelseitenformat. Es hapert ja schon an solchen Dingen. Ich denke, da hilft dann auch kein MadeToPrint o.ä. …?


als Antwort auf: [#558191]

Vergleich und Aussortierung gleicher PDF-Inhalte

Ralf Hobirk
Beiträge gesamt: 5803

22. Jun 2017, 16:28
Beitrag # 8 von 13
Beitrag ID: #558193
Bewertung:
(3511 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Grundsätzliche Frage: Werden die Dokumente von verschiedenen Leuten angelegt oder hat das eine Person in der Hand, während die anderen nur an diesen Dokumenten arbeiten?

---
Viele Grüße aus Istrien Cool
Ralf
---
iMac i7 (12,2) 3,4 GHz, 16 GB | MacBook Pro 15" (8,2) 2,0 GHz, 16 GB | Mac Mini (3,1) als Server 2,53 GHz, 8 GB | 10.11.6 El Capitan | CS6 (ID 8.0.1)


als Antwort auf: [#558192]

Vergleich und Aussortierung gleicher PDF-Inhalte

Thomas Richard
Beiträge gesamt: 17814

22. Jun 2017, 16:56
Beitrag # 9 von 13
Beitrag ID: #558194
Bewertung:
(3507 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf: Heisst halt dann Musterseite A 1 und ist letztendlich eine Seite im Doppelseitenformat. Es hapert ja schon an solchen Dingen. Ich denke, da hilft dann auch kein MadeToPrint o.ä. …?

Mit Verlaub: Der Fisch stinkt vom Kopf.

Wenn da bei den Dokumenten schon keine saubere Ordnung herrscht, muss man sich nicht wundern wenn hinten Kuddelmuddel raus kommt.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/


als Antwort auf: [#558192]

Vergleich und Aussortierung gleicher PDF-Inhalte

Polylux
Beiträge gesamt: 1649

22. Jun 2017, 20:19
Beitrag # 10 von 13
Beitrag ID: #558195
Bewertung:
(3496 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo snowpixel,

klingt jetzt total Banane, aber ich würde wenn der Katalog druckfertig ist, einen Satz auf dem Laserdrucker ausdrucken und jemanden die Seiten einzeln durchblättern lassen und dabei vorwiegend auf die Seitenzahlen achten lassen.

Klingt total Oldschool und nach dem letzten Jahrhundert - ist es auch.
Aber unter den Voraussetzungen...
Chaos in den Musterseiten, veraltete Software, unterschiedliche Arbeitsweisen.

Wenn es Kataloge mit diesem Seitenumfang werden wie beschrieben, kann mein Lösungsvorschlag auch noch mitfinanziert werden.

Oder man geht das ganze Ding von vorne an und sucht systematisch nach einer praktikablen Herangehensweise von Anfang an. Vielleicht ja mit einem Softwareupdate - da gibts bestimmt dann auch neue Möglichkeiten.

Viele Grüße

Thomas Nagel


als Antwort auf: [#558194]

Vergleich und Aussortierung gleicher PDF-Inhalte

Polylux
Beiträge gesamt: 1649

22. Jun 2017, 20:28
Beitrag # 11 von 13
Beitrag ID: #558196
Bewertung:
(3495 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Eine Alternative fällt mir noch ein. Es gibt Software, welche Bilder an Hand der Motive vergleicht um Dubletten zu finden. Dabei lässt sich der Grad der Ähnlichkeit je nach Software in Prozentschritten einstellen.

1. Also jede Seite als Bild abspeichern.
2. Den Ordner mit den Bildern der Software vorlegen
3. Bei gefundenen sehr hohen Ähnlichkeiten die PDF-Seiten kontrollieren.

Wie sich das letztendlich bei Euch automatissieren lässt, kann ich nicht sagen.

Ein Beispiel für solch eine Software wäre SimilarImage https://tn123.org/simimages/

Viel Glück

Thomas Nagel


als Antwort auf: [#558195]

Vergleich und Aussortierung gleicher PDF-Inhalte

snowpixel
Beiträge gesamt: 94

23. Jun 2017, 08:41
Beitrag # 12 von 13
Beitrag ID: #558198
Bewertung:
(3425 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
guten Morgen aus München!

Vielen Dank für die Beiträge - und in der Tat - der Fisch stinkt schon mächtig ;)
Leider haben wir keinen Einfluss auf die Kundenvorgaben und müssen aus den Gegebenheiten das beste machen… Aber wie so oft, den Letzten beissen die Hunde…

Die beschriebenen Lösungsvorschläge sind aber - gemessen an dem schwindligen Gesamtkonzept- durchaus gangbare Wege.
Herzlichen Dank an alle Beteiligten!

Beste Grüße,
Olaf


als Antwort auf: [#558194]

Vergleich und Aussortierung gleicher PDF-Inhalte

Thomas Richard
Beiträge gesamt: 17814

23. Jun 2017, 12:52
Beitrag # 13 von 13
Beitrag ID: #558205
Bewertung:
(3376 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Ich bleibe dabei, dass die Untersuchung (optisch, semantisch sichtbarer Seiteninhalt als auch Codebasiert), zu viele Unwägbarkeiten aufweist, die meiner Erfahrung nach in der täglichen Katalogproduktion auftreten, als dass das sinnvoll weiterzuverfolgen wäre.

M.E. wäre im ersten Schritt eine assistierte, wenn nicht völlig automatisierte Dateinamenvergabe anzustreben. Darüber hinaus wäre per Befüllung mit Metadaten oder eben eine auf die Pagina begrenzte Untersuchung der PDFs ein gangbarer Ansatz.

Ich habe z.B. Jahre lang mit dem PDFmark 'pagelabel' dafür gesorgt, dass meine Einzelseiten PDFs mit übereinstimmender Pagina im Namen, in den Metas und im Seiteninhalt daherkamen.

Die Möglichkeiten PDFmarks einzuschleusen (siehe PDF- und Acrobat Bibel[1] und pdfmark Reference Manual [2]), haben in Zeiten der direkten PDFerzeugung aber leider deutlich nachgelassen.

[1] ftp://ftp.buerliag.ch/...26%2520PDF-Bibel.pdf
[2] http://www.adobe.com/...pdfmarkreference.pdf


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/


als Antwort auf: [#558198]
Hier Klicken X

Veranstaltungen

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen. pdf-icon Hier eine kleine Anleitung.

Veranstaltungen
26.09.2018

Hochschuloe der Medien, Stuttgart
Mittwoch, 26. Sept. 2018, 19.00 - 21.00 Uhr

Vertrag

Nur auf den ersten Blick scheint dieses Thema exotisch. Aber eine neue EU-Richtlinie und deren Auswirkungen auf deutsche Gesetze werden dieses Thema auch für Publisher interessant machen. Die EU-Richtlinie "2102 zu Barrierefreiheit" besagt folgendes: Ab dem 23. September 2018 müssen alle öffentlichen Stellen ihre neuen (Office- oder PDF-) Dokumente grundsätzlich barrierefrei veröffentlichen. Im Juni wurde der Gesetzentwurf zur Umsetzung dieser Richtlinie im deutschen Bundestag vom "Ausschuss für Arbeit und Soziales" (19/2728) angenommen. Es wird also ernst für "öffentliche Stellen" und damit auch für deren Dienstleister, die mit der Umsetzung beauftragt werden. Die Richtlinie gilt nämlich nicht nur für Bundes- und Landesbehörden, sondern auch für Verbände, die im Allgemeininteresse liegende Aufgaben erfüllen. Das wären somit auch Gerichte, Polizeistellen, Krankenhäuser, Universitäten, Bibliotheken und einige mehr. Weitere Informationen findest Du hier, hier und hier. Wenn also oben genannte Auftraggeber zu Deinen Kunden zählen, solltest Du Dich vorbereiten. Und da es neben Websites auch um alle downloadbaren Dateien geht sind eben auch PDFs zukünftig barrierefrei zu erstellen. Arbeitet man in InDesign, können dort einige Vorbereitungen getroffen werden. Klaas Posselt ist der ausgewiesene Spezialist im deutschsprachigen Raum für alle Fragen rund um das Thema. Deshalb freuen wir uns, dass er uns in einem Vortrag die Grundlagen dazu vermitteln wird. Wir setzen voraus, dass Du den Umgang mit InDesign gewohnt bist, die Gründe und Vorteile von der Nutzung von Formaten kennst und weißt, wie man lange Dokumente „richtig“ aufbaut. Der Vortrag setzt bewusst DANACH ein. Inhalt des Vortrages ist der Hintergrund von „Barrierefreiheit“ und Möglichkeiten und Grenzen innerhalb von InDesign. Es wird erklärt, welche Bedeutung das kostenpflichtige PlugIn MadeToTag hat und warum und für was man es braucht. Ziel ist es den Rahmen aufzuzeigen, in dem sich das Thema „Barrierefreiheit“ in InDesign abspielt. Du weißt hinterher, wo die „Baustellen“ sind, wo Du weitergehende Infos bekommst und welchen Weg Du einschlagen musst. Am nächsten Tag veranstalten wir zwei Bootcamps, die das Thema praktisch vertiefen. "IDUGS Bootcamp #2" und "IDUGS Bootcamp #3" Klaas Posselt ist studierter Dipl.-Ing. für Druck- und Medientechnik und kam über verschiedene Anfragen zum Thema barrierefreie PDF Dokumente. Seit über 10 Jahren arbeitet er in den Bereichen Medientechnik und Publishing zwischen Medienherstellern, Druckermaschinen und digitalen Ausgabekanälen. Er schult, begleitet und unterstützt Kunden bei der Einführung und Optimierung von Publikationsprozessen und auf dem Weg zu neuen digitalen Ausgabekanälen — egal ob E-Books, barrierefreie PDFs oder Webplattformen. Als Chairman des PDF/UA Competence Center der PDF Association beteiligt er sich an der Weiterentwicklung und Verbreitung des Standards PDF/UA für barrierefreie PDF Dokumente. Diese Veranstaltung kommt nur zu Stande durch die freundliche Unterstützung von "Six Offene Systeme GmbH" -- Enterprise-Content-Management-System und Media-Asset-Management-System.

Nein

Organisator: IDUG Stuttgart

Kontaktinformation: Christoph Steffens, E-Mailchristoph.steffens AT gmail DOT com

https://idug47.eventbrite.de

Veranstaltungen
27.09.2018

Screen IT, Uster
Donnerstag, 27. Sept. 2018, 17.30 - 20.00 Uhr

Infoveranstaltung

Das Angebot an Publishing-Software ist gross. Deshalb empfiehlt sich eine externe Beratung durch unabhängige Software-Experten aus der jeweiligen Branche. Nicht immer muss es eine teure Mietlösung sein, die nach Beendigung der Mietdauer einem nicht einmal gehört. Es gibt sehr gute und auch in der Qualität ausreichende Alternativen, ja sogar kostenlose Freeware. Lassen Sie sich an diesem Abend einmal vor Augen führen, was diese Programme können und wie viel sie kosten.

Ja

Organisator: Screen IT und pre2media

Kontaktinformation: Peter Jäger, E-Mailinfo AT pre2media DOT ch

https://www.pre2media.ch/-1/de/infoanlass/