[GastForen Programme Web/Internet PDF Grundlagen / Web / eForms Allgemeine Frage zur Indexierung eines PDF-Dokuments

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Web/Internet - Webdesign, eForms
Themen
Beiträge
Moderatoren
Letzter Beitrag

Allgemeine Frage zur Indexierung eines PDF-Dokuments

ed.rigg
Beiträge gesamt: 1

19. Nov 2015, 19:58
Beitrag # 1 von 2
Bewertung:
(732 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Schönen guten Abend. Ich habe eine Frage zu einem etwas eigentümlichen Verhalten eines PDS-Dokuments und hoffe sehr, dass mir vielleicht hier jemand weiter helfen kann.

Es geht um ein PDF-Dokument, bei dem eine Akte eingescannt und dieser Scan in PDF umgewandelt wurde. Dabei handelt es sich um Seiten mit einer Tabelle, in deren ganz linker Spalte immer ein SO und dann ein "." gefolgt von der entsprechenden Reihennummer

Beispiel: SO.1(Reihe 1), SO.2(Reihe 2), SO.3(Reihe 3)

Jetzt kann ich ja mit der Suchfunktion dieses PDF-Dokument durchsuchen und habe dabei festgestellt, dass man in manchen Reihen nur ein Suchergebnis erhält, wenn man nicht nach SO sucht, sondern S0.

Beispiel: Ich will mit der Suchfunktion zu "SO.113" springen, bekomme aber kein Ergebnnis. Ich bekomme aber ein Ergebnis, wenn ich nach "S0.113" suche.
Dabei ist es aber so, dass sich dieses SO.x in keiner Reihe (optisch) von dem anderen SO.x unterscheidet - aus meiner Sicht gibt es also keinen Grund dafür, dass manchmal ein SO als S0 erkannt wird - in den meissten Fällen das SO aber tatsächlich als SO

Ist es vielleicht ein bekanntes Problem bzw. ist es plausibel, dass sowas geschieht? Das frage ich deshalb, weil es nämlich u.U. einen Grund geben könnte, weshalb der Index insofern manuell geändert wurde, dass manche Spalten nur über S0 aufgerufen werden können: und zwar eine optisch nicht sichtbare Markierung gewisser Reihen.

Ist hier vielleicht jemand anwesend, der mir etwas dazu sagen kann, ob dieses "Verhalten" des PDF-Dokuments normal ist? Ich würde mich sehr über ein Feedback freuen. Mfg, Ed Rigg
X

Allgemeine Frage zur Indexierung eines PDF-Dokuments

JoPo
Beiträge gesamt: 492

20. Nov 2015, 12:33
Beitrag # 2 von 2
Beitrag ID: #544790
Bewertung:
(671 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo ed.rigg,
willkommen hier im Forum.
Der Scan wurde in PDF gewandelt - bedeutet hier wohl, da ss eine automatische Texterkennung stattgefunden hat.
Offensichtlich sind bei der Texterkennung einige "O"s als Nullen erkannt worden.
Scanne das Dokument mit einer höheren Auflösung um der OCR-Funktion die Chance auf bessere Ergebnisse zu geben.
Wie ist das mit den "O"s dann?

Salü
Joachim


als Antwort auf: [#544773]

Aktuell

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.

pdf-icon Hier eine kleine Anleitung hinsichtlich Bedeutung der auszufüllenden Formularfelder.

Veranstaltungen
05.02.2021 - 05.11.2021

Digicomp Academy AG, Limmatstrasse 50, 8005 Zürich
Freitag, 05. Feb. 2021, 13.00 Uhr - Freitag, 05. Nov. 2021, 17.00 Uhr

Lehrgang

Bilden Sie sich zum zertifizierten Publishing-Multimedia-Profi aus. Neben Fotografie und Video befassen Sie sich mit der Medienproduktion, digitalen Publikationen und dem Webdesign für Desktop- und mobile Endgeräte.

Preis: CHF 10'500.-
Dauer: 30 Tage (ca. 210 Lektionen) – Unterricht findet jeweils am Freitag von 13 - 19 Uhr und Samstag von 09 - 17 Uhr statt

Ja

Organisator: Digicomp Academy AG

Kontaktinformation: Kundenberater-Team, E-Mailkundenberatung AT digicomp DOT ch

digicomp.ch/d/9PM

Veranstaltungen
05.03.2021 - 30.04.2021

Digicomp Academy AG, Zürich oder virtuell
Freitag, 05. März 2021, 13.00 Uhr - Freitag, 30. Apr. 2021, 17.00 Uhr

Lehrgang

Im berufsbegleitenden Web Publisher Lehrgang vertiefen Sie Ihr Wissen rund um das Thema Screendesign und die Umsetzung von Websites. Wir befähigen Sie dazu selbständig und professionell Ihren Webauftritt zu planen und in die Realität umzusetzen.

Preis: CHF 3'250.–
Dauer: 8.5 Tage - Unterricht findet jeweils am Freitag von 13 - 19 Uhr und Samstag von 09 - 17 Uhr statt.

Ja

Organisator: Digicomp Academy AG

Kontaktinformation: Kundenberater-Team, E-Mailkundenberatung AT digicomp DOT ch

digicomp.ch/d/9PWEB

Neuste Foreneinträge


Serien-Dateinamenänderung (mit Automator?) "nur die ersten 7 Schreibstellen"

Abschnitt mit Absatzformat beginnen?

Scriptphänomen alle 16 Steps

Fotobuch mit gleicher längster Bildseite

Schwarz überdruckt nicht

Von Quark nach Indesign konvertieren

Illustrator 2021 Stapelverarbeitung

Startvolum

Barrierefreies PDF> keine klickbaren Fußnoten im PDF (Tagbaum)

Arbeitsfarbraum ändert sich bei neu angelegten Dokumenten von selbst
medienjobs