Marco,
> Kurz gefragt: Gib mal ein Beispiel für eine deiner Regeln, die nicht als GREP in eine Textcleanup-Routine
> aufgenommen werden können.
Weißt Du, wenn ich jetzt ein Beispiel sage, dann kann ich für dieses Beispiel auch schon den dazu passenden GREP-Ausdruck zu dessen Lösung sagen.
So leicht möchte ich Dich nicht zum Triumpf führen. ;-)
Das will also nicht so recht funktionieren.
Im Moment schwenke ich zwischen zwei globalen Methoden:
1. wortlistengestützte Methode
In einer Liste sind die Wörter definiert, bei denen ein vorangestelltes Leerzeichen mit vorangestelltem Punkt und vorangestellter Zahl (z.B. '1. Jahr') durch ein geschütztes Leerzeichen ersetzt werden soll.
2. regelgestützte Methode
Eine Regel grenzt zunächst aus, wo die Einarbeitung eines geschützten Leerzeichens nicht notwendig ist (z.B. nach einer Absatzschaltung oder nach einer Zeilenschaltung). Positiv formuliert eventuell sogar: wenn der Zahl/den Zahlen eine Leerstelle vorangeht.
Spontan würde ich behaupten, daß die Wahrscheinlichkeit größer ist, daß die Zahl mit Punkt an das Folgewort geklammert werden muß als an das vorangehende Wort. So könnte ich mir vorstellen, daß man diese Bindung bevorzugt umsetzt und hinterher durch präzisere Regeln die fehlerhaften Umsetzungen wieder korrigiert.
a. Dort, wo eine Zahl, gefolgt von einem Punkt, durch zwei Leerzeichen umgeben wird, muß eines der beiden Leerzeichen durch ein geschütztes ersetzt werden.
b. Wenn ich das zweite Leerzeichen ersetze, erwarte ich weniger Fehler, als wenn ich das erste Leerzeichen ersetze.
c. Fehler, die sich durch Regel b eingeschlichen haben, können durch weitere Nachbehandlungen reduziert werden.
Die wortlistengestützte Methode richt nach einem umfangreichen Wörterbuch.
Und die skizzierte regelgestützte Methode nimmt bewußt Fehler in Kauf. Das ist mir unangenehm.
> Allerdings stellt sich mir die prinzipielle Frage, welche «gut formulierten Regeln» NICHT in einen
> oder mehrere GREP-Ausdrücke gepackt werden können.
Marco, darf ich Dich andersherum ganz frech nach so einer "gut formulierten Regel" fragen?
Alle entsprechenden Versuche meinerseits, eine allgemeinere Regel dafür zu formulieren, haben bald zu einer Entscheidung für die wortlistengestützte Methode geführt und zu der Entscheidung, nach dem endgültigen Umbruch vor Ablieferung nochmal alle Zeilengrenzen mit dem Auge nach den Zahlen abzuscannen, um händisch einzugreifen.
Und ich hätte diesen Part so gerne durch ein entprechendes professionelles Hilfsmittel ersetzt, das zuverlässiger als meine GREP-Listen und meine Sichtkontrolle ist.
als Antwort auf: [#382343]