[GastForen Programme Print/Bildbearbeitung Adobe InDesign GREP automatisch mehrere Absätze zusammenfassen

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

GREP automatisch mehrere Absätze zusammenfassen

Werek Orden
Beiträge gesamt: 31

4. Jul 2012, 10:32
Beitrag # 1 von 10
Bewertung:
(4844 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
HI

Ich habe eine hoffentlich schnelle Frage. Ich such in einer Datei nach Adressen wie die folgende.


Mister Andreas XXX
lala Endus, Inc.
1423 DDDD St.
Roamind, FL 54667
United States
Tel. +1 727-74x4-xxxx
Sales

Mit diesem GREP-Ausdruck finde ich auch alles.
Code
\r\r((.+\r)+) 

Die beiden harten Zeilenumbrüche trennen jeweils die vers. Adresse von einander in der Datei.

Meine Frage:
Wie muss ich den Ausdruck anpassen, so dass er mir nur die Adressen rauskopiert die den Vermerk Germany haben nicht USA oder United States usw. Diese sollen dann alle rausgezogen werden und in einen neue Datei kommen.

Jemand eine Idee.
X

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

4. Jul 2012, 12:16
Beitrag # 2 von 10
Beitrag ID: #497546
Bewertung:
(4820 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Werek

Ausgehend von deinem Grep, findet

\r\r(.+\r)+(Germany\s*\r)(.+\r)+

alle Adressblöcke, die in einem Absatz «Germany» (und evtl. nachfolgende Leerzeichen) enthalten.

Um all diese Germany-Adressen in eine neue Datei zu bringen, würde ich in einer Kopie des Dokuments den obigen Grep laufen lassen und die Fundstellen unterstreichen lassen. Dann alles löschen, was nicht unterstrichen ist.

Gruss, Marco


als Antwort auf: [#497538]

GREP automatisch mehrere Absätze zusammenfassen

drerol74
Beiträge gesamt: 508

4. Jul 2012, 13:06
Beitrag # 3 von 10
Beitrag ID: #497555
Bewertung:
(4800 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
... oder so, wenn du das öfters machen musst.

http://www.rolanddreger.net/...dressen_kopieren.mov

Bei Interesse schicke ich dir das Skript zu.

Schöne Grüße
Roland


als Antwort auf: [#497538]

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

4. Jul 2012, 13:45
Beitrag # 4 von 10
Beitrag ID: #497558
Bewertung:
(4775 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Roland

Ein schöner Grep! Wie bist du auf \X gekommen? In der Grep-Referenz von Gregor Fellenz habe ich das nicht gefunden. \X steht offenbar für den ersten Klammerausdruck, entspricht aber nicht dem markierten Unterausdruck innerhalb der Suche \1.

Gruss, Marco


als Antwort auf: [#497555]

GREP automatisch mehrere Absätze zusammenfassen

drerol74
Beiträge gesamt: 508

4. Jul 2012, 14:10
Beitrag # 5 von 10
Beitrag ID: #497561
Bewertung:
(4753 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Marco,

Danke!

\X steht für alle Zeichen (Einschließlich der Umbruchzeichen) - Unicode Grapheme.

Ich hab mir vor einiger Zeit mal die Mühe gemacht und bin alle Buchstaben-Kombinationen für GREP durchgegangen. Es könnte sein, dass ich es im Buch Mastering Regular Expressions von Friedl gefunden habe. Genau kann ich es aber leider nicht mehr sagen.


Schöne Grüße


als Antwort auf: [#497558]

GREP automatisch mehrere Absätze zusammenfassen

WernerPerplies
Beiträge gesamt: 2765

4. Jul 2012, 14:32
Beitrag # 6 von 10
Beitrag ID: #497562
Bewertung:
(4736 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Roland,

ja, z. B:
Jeffrey E. F. Friedl: Reguläre Ausdrücke. O'REILLY, 3. Auflage 2008, S. 123
Perl, PHP


als Antwort auf: [#497561]

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

4. Jul 2012, 15:05
Beitrag # 7 von 10
Beitrag ID: #497566
Bewertung:
(4719 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Danke für den Hinweis. \X ist also so etwas wie eine Super-Zeichenklasse (Kombination aus . und \r und \n). Interessant, wusste ich nicht.

In Rolands Grep müsste wohl \n durch \r ersetzt werden, da in Wereks Grep-Ausdruck kein \n (harter Zeilenumbruch) vorkommt. Ausserdem dürfen in den Adressblöcken keine Zeilen wie «Germany Sales Manager» u. Ä. vorkommen. Deshalb bei mir (Germany\s*\r). Statt \s hier übrigens besser Leerschlag, da \s ja auch die Umbruchzeichen umfasst.

Grüsse, Marco


als Antwort auf: [#497562]

GREP automatisch mehrere Absätze zusammenfassen

drerol74
Beiträge gesamt: 508

4. Jul 2012, 15:05
Beitrag # 8 von 10
Beitrag ID: #497568
Bewertung:
(4716 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Ja, dann muss es dort gewesen sein. Danke Werner!

Schöne Grüße
Roland


als Antwort auf: [#497562]

GREP automatisch mehrere Absätze zusammenfassen

Werek Orden
Beiträge gesamt: 31

4. Jul 2012, 17:35
Beitrag # 9 von 10
Beitrag ID: #497590
Bewertung:
(4657 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Wow vielen Dank euch allen, ich sehe "I am a GREP-Newbie." Jesus ist GREP mächtig, höchstwahrscheinlich sein Bruder ;-)

@Marco:
Genau, es sind Absatzenden keine harten Zeilenumbrüche. Dein Ausdruck hat super funktioniert.

@Roland:
Natürlich würde ich mich über das Skript freuen, allerdings habe ich nur CS5. Stellt sich die Frage ob dein Skript da noch geht.

Vielen Dank nochmals.


als Antwort auf: [#497568]

GREP automatisch mehrere Absätze zusammenfassen

Marco Morgenthaler
Beiträge gesamt: 2474

5. Jul 2012, 12:44
Beitrag # 10 von 10
Beitrag ID: #497632
Bewertung:
(4558 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Werek

Freut mich, dass der Grep auch auf deinem Computer funktioniert.

Inzwischen ist mir noch eine Lösung eingefallen, wie alle Adressblöcke ohne die Zeile «Germany» direkt ausgewählt (und gelöscht) werden können. Wir suchen also nicht die Textblöcke mit «Germany», sondern genau umgekehrt.

Die Grep-Suche lautet folgendermassen:

(?<=\r\r)((.+\r)(?!Germany *\r))+\r\r

(Ersetzen durch: Nichts)

Kernstück ist der Ausdruck ((.+\r)(?!Germany *\r))+
Interessant daran ist, dass im Grep ein Lookaround (hier neg. Lookahead) ebenfalls wiederholt wird (+), das heisst wir suchen mehrere Absätze (.+\r), denen jeweils kein «Germany» folgt, und zwar alle zwischen zwei Leerzeilen (\r\r). Kleine Einschränkungen gibt es: So müssen auch am Anfang und Ende des Textabschnittes zwei Leerzeilen (Absatzmarken \r) stehen, und die Adresszeile «Germany» darf nicht die erste oder letzte Zeile im Adressblock sein.

Diese Wiederholung des Lookaround hat mich auf eine weitere Idee gebracht.

Gibt es einen Grep, mit dem ich in einem Textabschnitt alle Absätze finde, in denen ein Wort nicht vorkommt? Und umgekehrt: Wie finde ich alle Absätze, in denen ein bestimmtes Wort vorkommt?

Beginnen wir mit dem letzten Problem. Der Grep

^([^\r]*\bInDesign\b[^\r]*)+$\r?

findet alle Absätze, in denen das Wort «InDesign» (in genau dieser Schreibweise) vorkommt, und zwar auch dann, wenn es am Absatzbeginn, Absatzende, am Anfang oder am Schluss eines Textabschnitts steht. Auch eine Absatzmarke am Schluss eines Textabschnitts ist nicht notwendig, um den Absatz mit dem Wort zu markieren. (Die Wortgrenze \b in \bInDesign\b kann auch weggelassen werden, je nachdem, was man genau will.)

Etwas kniffliger ist die Lösung, wenn wir alle Absätze finden wollen, in denen das Wort «InDesign» nicht vorkommt. Hier brauchen wir einen negativen Lookbehind, der wiederholt wird. Der Grep

^((?<!InDesign)\X)+?(?<!InDesign)$\r?

findet also alle Absätze, in denen das Wort «InDesign» nicht vorkommt. Der zweite negative Lookbehind (?<!InDesign)$\r? dient übrigens nur dazu, das Suchresultat nicht zu verfälschen, falls «InDesign» direkt am Schluss eines Absatzes oder am Ende des ganzen Textabschnitts steht.

Wie Roland oben im Thread erklärt hat, steht \X für alle Zeichen inkl. Umbruchzeichen (deshalb +?, das Fragezeichen macht die Wiederholung nicht «greedy»).

Im Prinzip gehen wir also Zeichen für Zeichen durch den Absatz und schauen, dass nie vorher das Wort «Indesign» steht. Erst wenn dies für jedes Zeichen im Absatz zutrifft, wird die Fundstelle markiert.

Diese Notizen sind sicher eher etwas für «Grepologen», aber vielleicht gibt es auch die eine oder andere praktische Anwendung.

Danke für die Geduld und Gruss
Marco


als Antwort auf: [#497590]
(Dieser Beitrag wurde von Marco Morgenthaler am 5. Jul 2012, 12:54 geändert)
X

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.

pdf-icon Hier eine kleine Anleitung hinsichtlich Bedeutung der auszufüllenden Formularfelder.

Veranstaltungen
14.05.2024

Online
Dienstag, 14. Mai 2024, 10.00 - 10.30 Uhr

Webinar

Prozessoptimierung ist ein Teamsport! Keine Software und keine Maschine allein kann Ihnen helfen, die Effizienzpotenziale Ihres Betriebes maximal auszuschöpfen. Von der Auftragsannahme über die Vorstufe und den Druck bis hin zur Weiterverarbeitung – alles muss optimal ineinandergreifen. Apropos Weiterverarbeitung – in vielen Druckbetrieben fristet sie in Sachen Prozessoptimierung immer noch ein Schattendasein. Dabei liegen hier mittlerweile die größten Einsparpotenziale! In einem Webinar von Horizon und Impressed erfahren Sie, wie Sie diese Einsparungen realisieren können. Horizon, bekannt für innovative Lösungen in der Druckweiterverarbeitung, bietet mit iCE LiNK eine Workflowlösung für die Weiterverarbeitung. iCE LiNK überwacht, visualisiert und analysiert Produktionsabläufe und unterstützt bei der Wartung – damit immer alles reibungslos läuft. Den gleichen Anspruch hat der von Impressed entwickelte Impressed Workflow Server – er ist die smarte PDF-Workflow-Lösung für Druckereien, die Datenmanagement, Preflight und Produktionssteuerung übernimmt. Im Webinar zeigen Ihnen die Experten von Horizon und Impressed, wie beide Lösungen im Team die Effizienz und Produktivität Ihres Betriebes steigern können. Melden Sie sich am besten gleich an, wir freuen uns auf Sie! PS: Melden Sie sich in jedem Fall an – sollten Sie zum Termin verhindert sein, erhalten Sie die Aufzeichnung.

kostenlos

Ja

Organisator: Impressed / Horizon

https://www.impressed.de/schulung.php?c=sDetail&sid=327

Einsparpotenziale in der Weiterverarbeitung
Veranstaltungen
16.05.2024

Online
Donnerstag, 16. Mai 2024, 10.00 - 10.30 Uhr

Webinar

Komplizierte, kleinteilige Aufträge; alles sehr speziell; seit Jahren bewährte Prozesse – da können wir nichts standardisieren und automatisieren! Das sagen viele Großformatdrucker – aber stimmt das wirklich, ist dem tatsächlich so? Günther Business Solutions und Impressed treten in einem Webinar den Gegenbeweis an. Experten beider Unternehmen zeigen, wie Großformatdrucker vom Einsatz zweier bewährter Lösungen profitieren können: • von advanter print+sign von Günther Business Solutions, dem ERP-System für den Großformatdruck, dass alle Phasen der Wertschöpfung im Large Format Printing abdeckt • von Impressed Workflow Server, der smarten PDF-Workflow-Lösung für Druckereien, die Datenmanagement, Preflight und Produktionssteuerung übernimmt Über die Kombination beider Lösungen können Großformatdrucker ihre Prozesse mit modernen Workflows Schritt für Schritt automatisieren – und so zügig deutliche Zeit- und Kosteneinsparungen realisieren. Das Webinar sollten Sie sich nicht entgehen lassen – damit Sie keine Effizienzpotenziale mehr liegen lassen. Melden Sie sich am besten gleich an, wir freuen uns auf Sie! PS: Melden Sie sich in jedem Fall an – sollten Sie zum Termin verhindert sein, erhalten Sie die Aufzeichnung.

kostenlos

Nein

Organisator: Impressed / Günther Business Solutions

https://www.impressed.de/schulung.php?c=sDetail&sid=326

Und es geht doch: Automatisierung im Großformatdruck!