[GastForen Programme Print/Bildbearbeitung Adobe InDesign GREP automatisch mehrere Absätze zusammenfassen

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

GREP automatisch mehrere Absätze zusammenfassen

Werek Orden
Beiträge gesamt: 31

4. Jul 2012, 10:32
Beitrag # 1 von 10
Bewertung:
(4647 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
HI

Ich habe eine hoffentlich schnelle Frage. Ich such in einer Datei nach Adressen wie die folgende.


Mister Andreas XXX
lala Endus, Inc.
1423 DDDD St.
Roamind, FL 54667
United States
Tel. +1 727-74x4-xxxx
Sales

Mit diesem GREP-Ausdruck finde ich auch alles.
Code
\r\r((.+\r)+) 

Die beiden harten Zeilenumbrüche trennen jeweils die vers. Adresse von einander in der Datei.

Meine Frage:
Wie muss ich den Ausdruck anpassen, so dass er mir nur die Adressen rauskopiert die den Vermerk Germany haben nicht USA oder United States usw. Diese sollen dann alle rausgezogen werden und in einen neue Datei kommen.

Jemand eine Idee.
X

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

4. Jul 2012, 12:16
Beitrag # 2 von 10
Beitrag ID: #497546
Bewertung:
(4623 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Werek

Ausgehend von deinem Grep, findet

\r\r(.+\r)+(Germany\s*\r)(.+\r)+

alle Adressblöcke, die in einem Absatz «Germany» (und evtl. nachfolgende Leerzeichen) enthalten.

Um all diese Germany-Adressen in eine neue Datei zu bringen, würde ich in einer Kopie des Dokuments den obigen Grep laufen lassen und die Fundstellen unterstreichen lassen. Dann alles löschen, was nicht unterstrichen ist.

Gruss, Marco


als Antwort auf: [#497538]

GREP automatisch mehrere Absätze zusammenfassen

drerol74
Beiträge gesamt: 502

4. Jul 2012, 13:06
Beitrag # 3 von 10
Beitrag ID: #497555
Bewertung:
(4603 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
... oder so, wenn du das öfters machen musst.

http://www.rolanddreger.net/...dressen_kopieren.mov

Bei Interesse schicke ich dir das Skript zu.

Schöne Grüße
Roland


als Antwort auf: [#497538]

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

4. Jul 2012, 13:45
Beitrag # 4 von 10
Beitrag ID: #497558
Bewertung:
(4578 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Roland

Ein schöner Grep! Wie bist du auf \X gekommen? In der Grep-Referenz von Gregor Fellenz habe ich das nicht gefunden. \X steht offenbar für den ersten Klammerausdruck, entspricht aber nicht dem markierten Unterausdruck innerhalb der Suche \1.

Gruss, Marco


als Antwort auf: [#497555]

GREP automatisch mehrere Absätze zusammenfassen

drerol74
Beiträge gesamt: 502

4. Jul 2012, 14:10
Beitrag # 5 von 10
Beitrag ID: #497561
Bewertung:
(4556 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Marco,

Danke!

\X steht für alle Zeichen (Einschließlich der Umbruchzeichen) - Unicode Grapheme.

Ich hab mir vor einiger Zeit mal die Mühe gemacht und bin alle Buchstaben-Kombinationen für GREP durchgegangen. Es könnte sein, dass ich es im Buch Mastering Regular Expressions von Friedl gefunden habe. Genau kann ich es aber leider nicht mehr sagen.


Schöne Grüße


als Antwort auf: [#497558]

GREP automatisch mehrere Absätze zusammenfassen

WernerPerplies
Beiträge gesamt: 2703

4. Jul 2012, 14:32
Beitrag # 6 von 10
Beitrag ID: #497562
Bewertung:
(4539 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Roland,

ja, z. B:
Jeffrey E. F. Friedl: Reguläre Ausdrücke. O'REILLY, 3. Auflage 2008, S. 123
Perl, PHP


als Antwort auf: [#497561]

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

4. Jul 2012, 15:05
Beitrag # 7 von 10
Beitrag ID: #497566
Bewertung:
(4522 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Danke für den Hinweis. \X ist also so etwas wie eine Super-Zeichenklasse (Kombination aus . und \r und \n). Interessant, wusste ich nicht.

In Rolands Grep müsste wohl \n durch \r ersetzt werden, da in Wereks Grep-Ausdruck kein \n (harter Zeilenumbruch) vorkommt. Ausserdem dürfen in den Adressblöcken keine Zeilen wie «Germany Sales Manager» u. Ä. vorkommen. Deshalb bei mir (Germany\s*\r). Statt \s hier übrigens besser Leerschlag, da \s ja auch die Umbruchzeichen umfasst.

Grüsse, Marco


als Antwort auf: [#497562]

GREP automatisch mehrere Absätze zusammenfassen

drerol74
Beiträge gesamt: 502

4. Jul 2012, 15:05
Beitrag # 8 von 10
Beitrag ID: #497568
Bewertung:
(4519 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Ja, dann muss es dort gewesen sein. Danke Werner!

Schöne Grüße
Roland


als Antwort auf: [#497562]

GREP automatisch mehrere Absätze zusammenfassen

Werek Orden
Beiträge gesamt: 31

4. Jul 2012, 17:35
Beitrag # 9 von 10
Beitrag ID: #497590
Bewertung:
(4460 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Wow vielen Dank euch allen, ich sehe "I am a GREP-Newbie." Jesus ist GREP mächtig, höchstwahrscheinlich sein Bruder ;-)

@Marco:
Genau, es sind Absatzenden keine harten Zeilenumbrüche. Dein Ausdruck hat super funktioniert.

@Roland:
Natürlich würde ich mich über das Skript freuen, allerdings habe ich nur CS5. Stellt sich die Frage ob dein Skript da noch geht.

Vielen Dank nochmals.


als Antwort auf: [#497568]

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

5. Jul 2012, 12:44
Beitrag # 10 von 10
Beitrag ID: #497632
Bewertung:
(4361 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Werek

Freut mich, dass der Grep auch auf deinem Computer funktioniert.

Inzwischen ist mir noch eine Lösung eingefallen, wie alle Adressblöcke ohne die Zeile «Germany» direkt ausgewählt (und gelöscht) werden können. Wir suchen also nicht die Textblöcke mit «Germany», sondern genau umgekehrt.

Die Grep-Suche lautet folgendermassen:

(?<=\r\r)((.+\r)(?!Germany *\r))+\r\r

(Ersetzen durch: Nichts)

Kernstück ist der Ausdruck ((.+\r)(?!Germany *\r))+
Interessant daran ist, dass im Grep ein Lookaround (hier neg. Lookahead) ebenfalls wiederholt wird (+), das heisst wir suchen mehrere Absätze (.+\r), denen jeweils kein «Germany» folgt, und zwar alle zwischen zwei Leerzeilen (\r\r). Kleine Einschränkungen gibt es: So müssen auch am Anfang und Ende des Textabschnittes zwei Leerzeilen (Absatzmarken \r) stehen, und die Adresszeile «Germany» darf nicht die erste oder letzte Zeile im Adressblock sein.

Diese Wiederholung des Lookaround hat mich auf eine weitere Idee gebracht.

Gibt es einen Grep, mit dem ich in einem Textabschnitt alle Absätze finde, in denen ein Wort nicht vorkommt? Und umgekehrt: Wie finde ich alle Absätze, in denen ein bestimmtes Wort vorkommt?

Beginnen wir mit dem letzten Problem. Der Grep

^([^\r]*\bInDesign\b[^\r]*)+$\r?

findet alle Absätze, in denen das Wort «InDesign» (in genau dieser Schreibweise) vorkommt, und zwar auch dann, wenn es am Absatzbeginn, Absatzende, am Anfang oder am Schluss eines Textabschnitts steht. Auch eine Absatzmarke am Schluss eines Textabschnitts ist nicht notwendig, um den Absatz mit dem Wort zu markieren. (Die Wortgrenze \b in \bInDesign\b kann auch weggelassen werden, je nachdem, was man genau will.)

Etwas kniffliger ist die Lösung, wenn wir alle Absätze finden wollen, in denen das Wort «InDesign» nicht vorkommt. Hier brauchen wir einen negativen Lookbehind, der wiederholt wird. Der Grep

^((?<!InDesign)\X)+?(?<!InDesign)$\r?

findet also alle Absätze, in denen das Wort «InDesign» nicht vorkommt. Der zweite negative Lookbehind (?<!InDesign)$\r? dient übrigens nur dazu, das Suchresultat nicht zu verfälschen, falls «InDesign» direkt am Schluss eines Absatzes oder am Ende des ganzen Textabschnitts steht.

Wie Roland oben im Thread erklärt hat, steht \X für alle Zeichen inkl. Umbruchzeichen (deshalb +?, das Fragezeichen macht die Wiederholung nicht «greedy»).

Im Prinzip gehen wir also Zeichen für Zeichen durch den Absatz und schauen, dass nie vorher das Wort «Indesign» steht. Erst wenn dies für jedes Zeichen im Absatz zutrifft, wird die Fundstelle markiert.

Diese Notizen sind sicher eher etwas für «Grepologen», aber vielleicht gibt es auch die eine oder andere praktische Anwendung.

Danke für die Geduld und Gruss
Marco


als Antwort auf: [#497590]
(Dieser Beitrag wurde von Marco Morgenthaler am 5. Jul 2012, 12:54 geändert)
X

Aktuell

Farbmanagement
colorant_300

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.

pdf-icon Hier eine kleine Anleitung hinsichtlich Bedeutung der auszufüllenden Formularfelder.

Veranstaltungen
09.05.2023

Digicomp (Bern, Basel, Zürich)
Dienstag, 09. Mai 2023, 08.30 - 17.00 Uhr

Kurs

Sie verfügen über ein Abonnement der Creative Cloud, welches Adobe Acrobat DC Pro beinhaltet. Sind Sie unsicher, ob Ihre PDF Dateien für die jeweilige Druckausgabe geeignet sind? Lernen Sie in diesem Kurs das notwendige Rüstzeug für den sicheren Datenaustausch mit Druckdienstleistern. Erstellen Sie druckfähige PDF/X und prüfen Sie Ihre PDFs vor einer Weitergabe mit Acrobat DC Pro.

Dauer: 1 Tag
Preis: CHF 700.–, exkl. MWST

Ja

Organisator: Digicomp Academy AG

https://digicomp.ch/weiterbildung-media-communication/adobe/kurs-pruefen-von-druck-pdf-in-acrobat-dc-pro--basic

Prüfen von Druck-PDF in Acrobat DC Pro