Forenindex » Programme » Print/Bildbearbeitung » Adobe InDesign » Doppelte Einträge mit Grep löschen

Doppelte Einträge mit Grep löschen

Duplex
Beiträge gesamt: 62

4. Apr 2018, 14:07
Bewertung:

gelesen: 4013

Beitrag als Lesezeichen
Hallo zusammen,

ich habe mal wieder ein kleines Problem:
Aus einer Datenbank wird eine Geburtstagsliste exportiert, die Anordnung der Daten entspricht natürlich nicht dem gewünschten Layout. Mit Grep habe ich die Liste soweit bereinigt und angepasst. Leider bekomme ich 1 Problem nicht gelöst:

Iststand:
Stadt A
Geburtstagskind
Stadt A
Geburtstagskind
Stadt A
Geburtstagskind

Stadt B
Geburtstagskind
Stadt B
Geburtstagskind
Stadt B
Geburtstagskind

Sollstand:
Stadt A
Geburtstagskind
Geburtstagskind
Geburtstagskind

Stadt B
Geburtstagskind
Geburtstagskind
Geburtstagskind

Wie bekomme ich die doppelten Stadtbezeichnungen gelöscht?

Vielen Dank.
Duplex

Doppelte Einträge mit Grep löschen

Kai Rübsamen
  
Beiträge gesamt: 4684

4. Apr 2018, 14:59
Bewertung:

gelesen: 3996

Beitrag als Lesezeichen
Versuch es mal so:

Suchen nach: (.+\r)(.+\r)\1(.+\r)\1(.+\r)
Ändern in: $1$2$3$4

Wenn du mehrere Einträge hast, musst du das ggf. mehrmals laufen lassen.

In der Suche funktioniert theoretisch auch: ((.+\r)(.+\r)\2)+
Beim Ersetzen passieren da aber bei mir doofe Sachen.

Edit: Das ist Murks, weil nicht flexibel :(

Gruß Kai Rübsamen

(Dieser Beitrag wurde von Kai Rübsamen am 4. Apr 2018, 15:03 geändert)

Doppelte Einträge mit Grep löschen

Thomas Richard
Beiträge gesamt: 19339

4. Apr 2018, 15:05
Bewertung:

gelesen: 3990

Beitrag als Lesezeichen
Daten nach Excel. Dort passend sortieren und jeweils nur dem ersten Eintrag den Ort lassen, die restlichen mit einem Griff je Ortsname tilgen?


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/

Doppelte Einträge mit Grep löschen

Duplex
Beiträge gesamt: 62

4. Apr 2018, 15:25
Bewertung:

gelesen: 3987

Beitrag als Lesezeichen
Leider ist die Ausgangsdatei solch eine krudige, falsch sortierte PDF vom Amt, da hilft Excel leider nicht weiter. Ich bin froh, dass ich eine einigermaßen nutzbare Word-Datei erzeugen kann.

VG
Duplex

Doppelte Einträge mit Grep löschen

Ralf Hobirk
Beiträge gesamt: 5961

4. Apr 2018, 15:31
Bewertung:

gelesen: 3985

Beitrag als Lesezeichen
Hallo Duplex,

ich arbeite sehr viel mit GREP, auch in Verbindung mit Script. Ich kann mir nicht vorstellen, dass sich das Gewünschte in InDesign realisieren lässt. Außer vielleicht mit einem aufwändigen Script.

Ich sehe hier eher einen Ansatz in der Datenbank. Diese muss so aufgebaut sein, dass die Daten in der gewünschten Zusammenstellung exportiert werden. Dazu werden mehrere Datenbank-Tabellen erforderlich sein. Ist also eher ein Job für den Datenbankentwickler als für InDesign ;-)

Antwort auf: die Anordnung der Daten entspricht natürlich nicht dem gewünschten Layout

Aus einer Datenbank werden keine Layouts, sondern reine Daten exportiert. Einfluss hast du hier nur auf die Exportreihenfolge der Datensätze und Datenfelder.

Edit: Ich wurde jetzt so lange am Telefon aufgehalten, dass es inzwischen schon mehrere Antworten gibt ;-)

---
Viele Grüße,
Ralf
---
iMac i7 (18,3) 4,2 GHz, 32 GB 10.15.7 Catalina | MacBook Pro 15" (8,2) 2,0 GHz, 16 GB, 10.13.6 High Sierra | Mac Mini (6,1) als Server 2,5 GHz, 8 GB, 10.13.6 High Sierra | CC 2021 (ID 16.3.2)

(Dieser Beitrag wurde von Ralf Hobirk am 4. Apr 2018, 15:32 geändert)

Doppelte Einträge mit Grep löschen

Thomas Richard
Beiträge gesamt: 19339

4. Apr 2018, 15:55
Bewertung:

gelesen: 3971

Beitrag als Lesezeichen
Antwort auf: Leider ist die Ausgangsdatei solch eine krudige, falsch sortierte PDF vom Amt, da hilft Excel leider nicht weiter. Ich bin froh, dass ich eine einigermaßen nutzbare Word-Datei erzeugen kann.

Wenn diese Worddatei zu dem obigen Ergebnis in ID führt ist es in Excel mit einer Hand voll Klicks getan.
Kannst mir die Datei die du in ID Importierst geren per mail zukommen lassen (Mailadresse hier links per Klick auf meinen Accountnamen).


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/

Doppelte Einträge mit Grep löschen

Duplex
Beiträge gesamt: 62

4. Apr 2018, 16:18
Bewertung:

gelesen: 3964

Beitrag als Lesezeichen
Ist auf dem Weg . . .

Doppelte Einträge mit Grep löschen

Thomas Richard
Beiträge gesamt: 19339

4. Apr 2018, 17:37
Bewertung:

gelesen: 3953

Beitrag als Lesezeichen
Sodele ... Vorgehensweise:

Worddatei geöffnet, Apfel-A, Apfel-C, rüber zu TextWrangler, neues Dokument, Apfel-V

Hier dann mal Sonderzeichen eingeblendet und ausgemistet:

• doppelte Leerzeichen raus
• weitere unsichtbare Zeichen raus
• vor jedem Datensatz doppeltes Return eingebaut
Code
(\d\d\.\d\d\.)   -->  \r\1 


• jetzt jeweils einfaches Return mit Buchstabe davor und dahinter gegen Tab ersetzen
Code
(\b)\r(\b) -->  \1\t\2 


Speichern als MacOS Roman mit Classic Mac CR (wegen der Umlaute. Gern auch anders aber eben dann in Excel passend dazu öffnen, sonst sind sie futsch) und in Excel öffnen.

Beim Excel Öffnen eigentlich alles wie voreingestellt lassen:
Getrennt – Tabstopp – alle erkannten Spalten als Text deklarieren

Jetzt die einzige Handarbeit, jeweils die Wiederholungen gleicher Ortsnamen bis auf das erste Vorkommen und Zelleninhalte löschen. Da die meisten nur 2fach vorkommende Vorkommnisse sind, hätt man es eigentlich auch gleich in ID erledigen können.

Aber in Excel ist das umsortieren der Spalten von
Datum – zum x.Geburtstag – Herr/Frau Name – Ort
in
Ort – Name – Datum – x. J.

ein Kinderspiel.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/

(Dieser Beitrag wurde von Thomas Richard am 4. Apr 2018, 17:44 geändert)

Doppelte Einträge mit Grep löschen

Duplex
Beiträge gesamt: 62

5. Apr 2018, 08:32
Bewertung:

gelesen: 3857

Beitrag als Lesezeichen
Hallo Thomas,

danke für die schnelle und ausführliche Antwort.
Da TextWrangler nicht auf den Rechnern installiert ist (und Freeware nicht erlaubt ist), fällt diese Variante leider weg. Die meisten Kollegen kennen sich mit Excel leider auch nicht unbedingt aus, so daß das sortieren der Spalten schon zum Problem werden könnte.

Sonnige Grüße
Duplex

Doppelte Einträge mit Grep löschen

Thomas Richard
Beiträge gesamt: 19339

5. Apr 2018, 13:34
Bewertung:

gelesen: 3829

Beitrag als Lesezeichen
Text Wrangler war auch nur das von mir präferierte Werkzeug für solche Texteditoraufgaben, weil es u.A. eben auch GREP kann.
Wenn Freeware nicht in frage kommt, kauft halt BBEdit aus dem selben Hause, kommt dann auf 50$ je Arbeitsplatz.

Aber das ganze läuft für mich auf die hier schon oft gesehen 'keine Arme – keine Kekse' Konstellation hinaus.

Kein Geld für Software oder individuelle Programmierung die das Problem lösen könnte, kein Wille sich fürs händische Abarbeiten in maximal vereinfachter Version mit den nötigen Tools zu beschäftigen, …

… da bleibt dir dann wohl nur übrig, dich jeden Monat da durch zu ackern und die Doubletten in den Ortsnamen eben händisch herauszulöschen.

Das ist aber evtl. garnicht so schlimm, da ich mal vermute, dass die Daten die du vomamt bekommst, evtl. auch nicht jeden Monat identisch erzeugt werden. Wenn da der Sachbearbeiter nur irgendeine Option der PDF-Generierung in seinem Einwohnerdatenprogramm ändert, kommen evtl. zwar gleich aussehende, aber intern völlig anders aufgebaute Listen bei dir an, da wäre dann u.U. ein Script, dass das ganze abarbeitet, jeden Monat anzupassen, oder auch völlig wertlos.

Was mir bei den Daten noch aufgefallen ist:
Muss bei den Ortsteilen immer die Hauptgemeinde/Stadt noch mit aufgeführt werden? Grundsätzlich würde ich die Ortsteile schon in der Sortierung hinter den Hauptorten lassen, aber keiner deiner Kunden wird auf der Suche nach Geburtstagskindern seinen Ortsteil nicht finden, wenn nicht die Stadt noch mit dran steht. Oder habt ihr im Landkreis OT Namen doppelt?

Oder eben eine 2. Untersortierungsstufe bei den Orten

Stadt/Gemeinde XY
   XY
   Jubilar1
   Jubilar2
   …
   OT OT-Name
   Jubilar1
   Jubilar2
   …


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/