[GastForen Programme Print/Bildbearbeitung Adobe InDesign Problem mit Grep über Script - Abkürzungen

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

Problem mit Grep über Script - Abkürzungen

Guzzi-Birgit
Beiträge gesamt: 73

12. Mai 2017, 11:00
Beitrag # 1 von 9
Bewertung:
(2595 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo liebe HDSler,
ich arbeite seit kurzem mit einer Grepsammlung, die über ein Script ausgeführt wird. Diese Steuerdatei sollte modifiziert werden, um bei Abkürzungen (z.B., u.A., s.o., o.ä.) das Leerzeichen zu entfernen (falls vorhanden) und im nächsten Schritt ein Achtelgeviert einzufügen.

Code
// 
grep {findWhat:"\\<(?i)(e|o|u|s|z)\.\\x{0020}\\<(?i)(a|ä|b|o|u|t|v)\."} {changeTo:"$1\.~<$2\."} {includeHiddenLayers:false, includeMasterPages:false, includeFootnotes:true}
Löscht Leerzeichen bei e.V., z.B., u.a., z.T. s.o., s.u., o.ä.
//
grep {findWhat:"\\<(?i)(e|o|u|s|z)\.\\<(?i)(a|ä|b|o|u|t|v)\."} {changeTo:"$1\.~<$2\."} {includeHiddenLayers:false, includeMasterPages:false, includeFootnotes:true}
Fügt bei e. V., z.B., u.a., z.T. s.o., s.u., o.ä. ein Achtelgeviert ein.


So weit so gut. Leider greift Grep jetzt auch bei Satzanfängen (Um Antwort...), interessanter Weise nur bei Wörtern mit zwei Buchstaben.

Ich steh total auf dem Schlauch. Kann mir jemand auf die Sprünge helfen, wo der Fehler liegt?

Sonnige Grüße
Birgit

MAC OS X El Capitan 10.11.6
AdobeCreativeCloud CC2017
X

Problem mit Grep über Script - Abkürzungen

Ralf Hobirk
Beiträge gesamt: 5803

12. Mai 2017, 11:18
Beitrag # 2 von 9
Beitrag ID: #557403
Bewertung:
(2592 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Brirgit,

bei GREP in Javascript muss immer doppelt escaped werden.

Code
\. 

findet ein beliebiges Zeichen.
Um den Punkt zu erwischen, muss es so aussehen:
Code
\\. 


---
Viele Grüße aus Istrien Cool
Ralf
---
iMac i7 (12,2) 3,4 GHz, 16 GB | MacBook Pro 15" (8,2) 2,0 GHz, 16 GB | Mac Mini (3,1) als Server 2,53 GHz, 8 GB | 10.11.6 El Capitan | CS6 (ID 8.0.1)


als Antwort auf: [#557402]

Problem mit Grep über Script - Abkürzungen

Guzzi-Birgit
Beiträge gesamt: 73

12. Mai 2017, 11:27
Beitrag # 3 von 9
Beitrag ID: #557404
Bewertung:
(2583 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Ralf,

ach Mensch, das war ja einfach . . . wenn man es weiß :-)
Klappt einwandfrei, vielen Dank!!!

Viele Grüße
Birgit
macOS Sierra 10.12.6
AdobeCreativeCloud CC2018


als Antwort auf: [#557403]

Problem mit Grep über Script - Abkürzungen

funkturmmitte
Beiträge gesamt: 100

15. Mai 2017, 15:33
Beitrag # 4 von 9
Beitrag ID: #557441
Bewertung:
(2371 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hat es einen bestimmten Grund, dass das Achtelgeviert nicht schon im ersten Schritt eingefügt wird?

Z.B. So:

Code
grep	{findWhat:"\\<(?i)(e|o|u|s|z)\\.\\x{0020}?\\<(?i)(a|ä|b|o|u|t|v)\."}	{changeTo:"$1\\.~<$2\\."} 


Gruß
Oliver


als Antwort auf: [#557402]

Problem mit Grep über Script - Abkürzungen

Guzzi-Birgit
Beiträge gesamt: 73

16. Mai 2017, 09:32
Beitrag # 5 von 9
Beitrag ID: #557455
Bewertung:
(2309 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hi Oliver,

ja, da hab ich mir was bei gedacht. So wie es jetzt ist, also in zwei Durchgängen, »erwische« ich auch die, bei denen die Abkürzungen von vorneherein ganz ohne Leerzeichen geschrieben sind. Das wäre ja anders nicht der Fall.

Viele Grüße
Birgit
macOS Sierra 10.12.6
AdobeCreativeCloud CC2018


als Antwort auf: [#557441]

Problem mit Grep über Script - Abkürzungen

funkturmmitte
Beiträge gesamt: 100

16. Mai 2017, 09:59
Beitrag # 6 von 9
Beitrag ID: #557459
Bewertung:
(2302 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Birgit!
In deiner Grep-Suche kommt diese Formulierung vor:
Code
\\x{0020}? 

Das ist ein Leerzeichen, welches vorkommen kann oder auch nicht.
Also wird mit der Suche sowohl z.B. als auch z. B. gefunden - allerdings nur, wenn das Standard Leerzeichen genutzt wird.
Wenn du alle möglichen Leerzeichen abdecken willst müsstest Du statt \\x{0020}? \\p{space_separator}? nutzen.

Gruß
Oliver


als Antwort auf: [#557455]

Problem mit Grep über Script - Abkürzungen

Kai Rübsamen
  
Beiträge gesamt: 4537

16. Mai 2017, 10:01
Beitrag # 7 von 9
Beitrag ID: #557460
Bewertung:
(2302 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Birgit,

das lässt sich auch in einem Durchgang erledigen und dann auch noch ein bisschen eleganter schreiben:

(?i)(\b[eousz]\.)\x20?([aäboutv]\.)

(?i) funktioniert wie ein Schalter. Es reicht also, wenn er 1x gesetzt wird.

\b ob \b oder \< ist egal, \b funktioniert aber vorne u. hinten und ist zumindest für mich vom Zeichen her etwas eindeutiger.

[eousz] Es ist nicht egal, ob du [eousz] oder (e|o|u|s|z) suchst. Im ersten Fall wird nur 1x gesucht um das "z" zu finden, im letzten Fall braucht es 5 Suchläufe. Zeichenklassen sind daher in solchen Fällen immer performanter als Alternationen.

\x20? Du suchst ein Leerzeichen, das da sein kann oder auch nicht. \x20 ist dabei die Kurzschreibweise von \x{0020}. Weil du das Leerzeichen u.U. rauswerfen willst, braucht es vorher und nachher runde Klammern, die dann mit $1 und $2 referenziert werden.

Edit: Ich sehe gerade, Oliver hat in der Zwischenzeit auch etwas geschrieben. @Oliver: Schau dir mal Birgits Beispiel genauer an. Da ist kein "?" hinter dem Leerzeichen. Das hast du wohl autom. gesetzt und daher benötigt sie zwei Durchläufe.

Gruß Kai Rübsamen


als Antwort auf: [#557455]
(Dieser Beitrag wurde von Kai Rübsamen am 16. Mai 2017, 10:04 geändert)

Anhang:
Bildschirmfoto 2017-05-16 um 09.54.11.png (57.1 KB)

Problem mit Grep über Script - Abkürzungen

Guzzi-Birgit
Beiträge gesamt: 73

16. Mai 2017, 10:23
Beitrag # 8 von 9
Beitrag ID: #557461
Bewertung:
(2289 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Kai, hallo Oliver,

vielen Dank für eure Tipps, im Moment bin ich schon froh, dass es (so wie es ist) einwandfrei und sehr zügig funktioniert.

Aber ihr habt natürlich recht, das lässt sich bestimmt noch verbessern . . . ich übe noch :-)

Ich werde mich da nochmal ran setzen, wenn ich ein bisschen freie Zeit habe.

Viele Grüße
Birgit
macOS Sierra 10.12.6
AdobeCreativeCloud CC2018


als Antwort auf: [#557460]

Problem mit Grep über Script - Abkürzungen

Hans Haesler
Beiträge gesamt: 5606

17. Mai 2017, 21:08
Beitrag # 9 von 9
Beitrag ID: #557506
Bewertung:
(2187 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Oliver,

hast Du Deinen Vorschlag im Beitrag #4 ausprobiert?

Bei mir ist das Ergebnis:

Zitat e\. V\., z\. B\., u\. a\., z\. T\. s\. o\., s\. u\., o\. ä\.

Im Ersetzen-Muster muss der Punkt nicht escaped werden.

Falls dennoch: Wenn einfach (= \.), dann passiert zwar nichts. Aber wenn doppelt (= \\.), wird ein Backslash eingefügt.

Gruss, Hans


als Antwort auf: [#557441]
X

Aktuell

Veranstaltungen

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen. pdf-icon Hier eine kleine Anleitung.

Veranstaltungen
26.09.2018

Hochschuloe der Medien, Stuttgart
Mittwoch, 26. Sept. 2018, 19.00 - 21.00 Uhr

Vertrag

Nur auf den ersten Blick scheint dieses Thema exotisch. Aber eine neue EU-Richtlinie und deren Auswirkungen auf deutsche Gesetze werden dieses Thema auch für Publisher interessant machen. Die EU-Richtlinie "2102 zu Barrierefreiheit" besagt folgendes: Ab dem 23. September 2018 müssen alle öffentlichen Stellen ihre neuen (Office- oder PDF-) Dokumente grundsätzlich barrierefrei veröffentlichen. Im Juni wurde der Gesetzentwurf zur Umsetzung dieser Richtlinie im deutschen Bundestag vom "Ausschuss für Arbeit und Soziales" (19/2728) angenommen. Es wird also ernst für "öffentliche Stellen" und damit auch für deren Dienstleister, die mit der Umsetzung beauftragt werden. Die Richtlinie gilt nämlich nicht nur für Bundes- und Landesbehörden, sondern auch für Verbände, die im Allgemeininteresse liegende Aufgaben erfüllen. Das wären somit auch Gerichte, Polizeistellen, Krankenhäuser, Universitäten, Bibliotheken und einige mehr. Weitere Informationen findest Du hier, hier und hier. Wenn also oben genannte Auftraggeber zu Deinen Kunden zählen, solltest Du Dich vorbereiten. Und da es neben Websites auch um alle downloadbaren Dateien geht sind eben auch PDFs zukünftig barrierefrei zu erstellen. Arbeitet man in InDesign, können dort einige Vorbereitungen getroffen werden. Klaas Posselt ist der ausgewiesene Spezialist im deutschsprachigen Raum für alle Fragen rund um das Thema. Deshalb freuen wir uns, dass er uns in einem Vortrag die Grundlagen dazu vermitteln wird. Wir setzen voraus, dass Du den Umgang mit InDesign gewohnt bist, die Gründe und Vorteile von der Nutzung von Formaten kennst und weißt, wie man lange Dokumente „richtig“ aufbaut. Der Vortrag setzt bewusst DANACH ein. Inhalt des Vortrages ist der Hintergrund von „Barrierefreiheit“ und Möglichkeiten und Grenzen innerhalb von InDesign. Es wird erklärt, welche Bedeutung das kostenpflichtige PlugIn MadeToTag hat und warum und für was man es braucht. Ziel ist es den Rahmen aufzuzeigen, in dem sich das Thema „Barrierefreiheit“ in InDesign abspielt. Du weißt hinterher, wo die „Baustellen“ sind, wo Du weitergehende Infos bekommst und welchen Weg Du einschlagen musst. Am nächsten Tag veranstalten wir zwei Bootcamps, die das Thema praktisch vertiefen. "IDUGS Bootcamp #2" und "IDUGS Bootcamp #3" Klaas Posselt ist studierter Dipl.-Ing. für Druck- und Medientechnik und kam über verschiedene Anfragen zum Thema barrierefreie PDF Dokumente. Seit über 10 Jahren arbeitet er in den Bereichen Medientechnik und Publishing zwischen Medienherstellern, Druckermaschinen und digitalen Ausgabekanälen. Er schult, begleitet und unterstützt Kunden bei der Einführung und Optimierung von Publikationsprozessen und auf dem Weg zu neuen digitalen Ausgabekanälen — egal ob E-Books, barrierefreie PDFs oder Webplattformen. Als Chairman des PDF/UA Competence Center der PDF Association beteiligt er sich an der Weiterentwicklung und Verbreitung des Standards PDF/UA für barrierefreie PDF Dokumente. Diese Veranstaltung kommt nur zu Stande durch die freundliche Unterstützung von "Six Offene Systeme GmbH" -- Enterprise-Content-Management-System und Media-Asset-Management-System.

Nein

Organisator: IDUG Stuttgart

Kontaktinformation: Christoph Steffens, E-Mailchristoph.steffens AT gmail DOT com

https://idug47.eventbrite.de

Veranstaltungen
27.09.2018

Screen IT, Uster
Donnerstag, 27. Sept. 2018, 17.30 - 20.00 Uhr

Infoveranstaltung

Das Angebot an Publishing-Software ist gross. Deshalb empfiehlt sich eine externe Beratung durch unabhängige Software-Experten aus der jeweiligen Branche. Nicht immer muss es eine teure Mietlösung sein, die nach Beendigung der Mietdauer einem nicht einmal gehört. Es gibt sehr gute und auch in der Qualität ausreichende Alternativen, ja sogar kostenlose Freeware. Lassen Sie sich an diesem Abend einmal vor Augen führen, was diese Programme können und wie viel sie kosten.

Ja

Organisator: Screen IT und pre2media

Kontaktinformation: Peter Jäger, E-Mailinfo AT pre2media DOT ch

https://www.pre2media.ch/-1/de/infoanlass/