[GastForen Programme Web/Internet PDF Grundlagen / Web / eForms PDF Information auslesen und in xml-datei schreiben

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Web/Internet - Webdesign, eForms
Themen
Beiträge
Moderatoren
Letzter Beitrag

PDF Information auslesen und in xml-datei schreiben

KosmoM
Beiträge gesamt: 6

18. Apr 2011, 13:16
Beitrag # 1 von 11
Bewertung:
(14747 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

ich hätte ine Frage vielleicht kann man mir ja helfen. Ich suche eine Möglichkeit (gegebenfalls auch zur Eigenrealisierung) folgendes zu machen:

PDFs sollen nach dem Posten Rechnungsnummer durchsucht werden. Anschließend soll die Nummer, die dort angegeben wird, in eine XMl-Datei geschrieben werden. Wie realisere ich das?
X

PDF Information auslesen und in xml-datei schreiben

klasinger
Beiträge gesamt: 1655

18. Apr 2011, 15:59
Beitrag # 2 von 11
Beitrag ID: #469417
Bewertung:
(14725 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

es fällt ein wenig schwer bei den dürftigen Informationen den passenden Rat zu geben. Nach bisherigem Kenntnisstand würde ich sagen: Abschreiben.

Also:
- Welche Software verwendest du,
- Auf welcher Plattform bist du untergwegs,
- Soll es vollautom. laufen,
- Wie worden die PDFs erstellt (hast du darauf ggf. Einfluss)?
...und alles weitere was wir nicht wissen, aber wichtig sein könnten.


als Antwort auf: [#469385]

PDF Information auslesen und in xml-datei schreiben

KosmoM
Beiträge gesamt: 6

18. Apr 2011, 16:11
Beitrag # 3 von 11
Beitrag ID: #469420
Bewertung:
(14717 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Allso, wir bewegen uns in der farbenfrohen Welt von MS Windows 7. Die PDFs werden mit freepdf erstellt. Das ganze sollte vollautomatisch ablaufen. Sollte dies ein Problem sein, ginge auch die manuelle Version.

Wollte das erstmal selbst programmieren, allerdings kosten die Lizenzen zum Bearbeiten der Programmbibliothek kosten echt viel Geld.


als Antwort auf: [#469417]

PDF Information auslesen und in xml-datei schreiben

mk-will
Beiträge gesamt: 1251

18. Apr 2011, 16:50
Beitrag # 4 von 11
Beitrag ID: #469426
Bewertung:
(14703 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo KosmoM,

Zitat Die PDFs werden mit freepdf erstellt.

Liegt denn überhaupt noch echter Text in den PDFs vor?

Ich kenne bspw. ein "freepdf" (keine Ahnung, ob es mit dem Deinen identisch ist), das Text nicht als Text sondern als Kurven in das PDF schreibt.

Gruß
Stephan

ps: Die Informationslage ist immer noch seeeeeeeeeeehr dünn.


als Antwort auf: [#469420]

PDF Information auslesen und in xml-datei schreiben

KosmoM
Beiträge gesamt: 6

18. Apr 2011, 17:01
Beitrag # 5 von 11
Beitrag ID: #469428
Bewertung:
(14698 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
meinte das hier http://freepdfxp.de/

Lieder kann ich nur das weiterleiten, was man mir sagt. Das ist also quasi die Vorlage des Kunden:

Er nutzt freepdfxp. Er nutzt Lexware zum erstellen von Rechnungen, Angeboten etc. und sichert diese als pdf ab. Nun möchte er ein Programm, dass er so einstellen kann, dass die PDF nach einem Begriff durchsucht (Rechnungsnummer, Angebotsnummer etc). Das Ergebnis soll anschließend in eine xml-Datei übergeben werden.


als Antwort auf: [#469426]
(Dieser Beitrag wurde von KosmoM am 18. Apr 2011, 17:10 geändert)

PDF Information auslesen und in xml-datei schreiben

klasinger
Beiträge gesamt: 1655

18. Apr 2011, 19:50
Beitrag # 6 von 11
Beitrag ID: #469448
Bewertung:
(14659 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

1.) FreePDF sollte echten Text erstellen. Öffne mal ein PDF, bspw. im Adobe Reader und suche nach einem Begriff (STRG + F) der auf der Seite steht - sollte der gefunden werden, hätten wir das schonmal geklärt.
2.) Setzt du schon irgendwelche PDF Software ein, auf die man bauen könnte - viele hier nutzen Acrobat.
3.) Grundsätzlich: Warum muss aus dem PDF ein XML mit spez. Daten erstellt werden? Strukturierte Daten, wie XML, erstellt man am besten beim Urspung und nicht nach 7 Konvertierungen...

Nimm dir mal sie Zeit beantworte unsere Fragen ausführlich und lege deine Hintergedanken dar.


als Antwort auf: [#469428]

PDF Information auslesen und in xml-datei schreiben

KosmoM
Beiträge gesamt: 6

19. Apr 2011, 09:59
Beitrag # 7 von 11
Beitrag ID: #469469
Bewertung:
(14607 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Also, Freepdfxp kann echten Text erstellen.

Ja es wird Acrobat eingesetzt, wenn auch eine etwas ältere Version (Version 9).

Wie gesagt, der Kunde verlangt es so. Scheinbar soll dies aufgrund einer Dokumentenverwaltungssoftware so sein, die xml-Dateien zur Indexerstellung nutzt. Und da in der Fassung, wie der Kunde sie nutzt, die Konvertierung nicht automatisch geschieht, so muss dies über eine externe Softwarelösung geschehen.


als Antwort auf: [#469448]

PDF Information auslesen und in xml-datei schreiben

Polylux
Beiträge gesamt: 1771

19. Apr 2011, 11:33
Beitrag # 8 von 11
Beitrag ID: #469488
Bewertung:
(14569 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Leider immer noch nicht mehr Infos....

Könnte man die Rechnugnsnumemr nicht einfach als Metadaten zusätzlich ins PDF schreiben (XMP oder PDF-Keywords) und dies dann wieder auslesen?

In einem Switch-Workflow funktioniert das problemlos. Aber Software, mit der man Geld verdienen möchte, kostet halt auch Geld.


als Antwort auf: [#469469]

PDF Information auslesen und in xml-datei schreiben

KosmoM
Beiträge gesamt: 6

19. Apr 2011, 11:46
Beitrag # 9 von 11
Beitrag ID: #469490
Bewertung:
(14560 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Polylux ] Leider immer noch nicht mehr Infos....

Könnte man die Rechnugnsnumemr nicht einfach als Metadaten zusätzlich ins PDF schreiben (XMP oder PDF-Keywords) und dies dann wieder auslesen?

In einem Switch-Workflow funktioniert das problemlos. Aber Software, mit der man Geld verdienen möchte, kostet halt auch Geld.


Kommt drauf an, ob Lexware/freepdf sowas unterstützten. Man möchte ja nicht alzu viel Software verwenden.


als Antwort auf: [#469488]

PDF Information auslesen und in xml-datei schreiben

Polylux
Beiträge gesamt: 1771

19. Apr 2011, 14:01
Beitrag # 10 von 11
Beitrag ID: #469526
Bewertung:
(14534 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ KosmoM ] Kommt drauf an, ob Lexware/freepdf sowas unterstützten.

Und wer könnte das denn herausfinden?


als Antwort auf: [#469490]

PDF Information auslesen und in xml-datei schreiben

KosmoM
Beiträge gesamt: 6

20. Apr 2011, 14:33
Beitrag # 11 von 11
Beitrag ID: #469647
Bewertung:
(14477 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Polylux ]
Antwort auf [ KosmoM ] Kommt drauf an, ob Lexware/freepdf sowas unterstützten.

Und wer könnte das denn herausfinden?


Entschuldigung, ich war jetzt tatsächlich nicht darauf, die Community die Lösung dieser Frage/Festellung suchen zu lassen. Dieser Post sollte eigentlich heißen: "Ich such dann mal und melde mich, wenn ich genaueres weiß."


als Antwort auf: [#469526]
X