[GastForen Programme Print/Bildbearbeitung Adobe InDesign Grep-Suche nach Web- und Emailadressen

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

Grep-Suche nach Web- und Emailadressen

Rashid
Beiträge gesamt: 5

9. Sep 2008, 15:08
Beitrag # 1 von 7
Bewertung:
(8501 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo allesamt,

hoffe ihr könnt mir weiterhelfen. Ich suche eine Möglichkeit, nach Webadressen zu suchen, die keine einheitliche Form haben, d.h. sie können mal mit http, https oder einfach nur www. beginnen.

Das Problem besteht darin, die ganze Webadresse zu greifen, damit sie per Script mit einem Zeichenformat versehen werden kann. Händig würde das ganze Stunden dauern.

Selbiges gilt für für emailadressen. Da existiert zwar bereits eine Grepsuche, aber die Performance ist sehr schlecht. Idealerweise könnte man mit einer Suche web- und emailadressen finden, damit nicht zwei schleifen laufen müssen, die Laufzeit unnötig verlängern.

Würde mich über jeden Lösungsweg freuen :-)
Vielen Dank im Voraus,

Rash
X

Grep-Suche nach Web- und Emailadressen

Marco Morgenthaler
Beiträge gesamt: 2474

9. Sep 2008, 15:45
Beitrag # 2 von 7
Beitrag ID: #365431
Bewertung:
(8480 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Rashid

Teste mal folgende Ausdrücke im Suchen-Feld:

Für Internetadressen:

\<(http|www)\S*\>

Für Mailadressen:

\<\S*@\S*\>

Also Wortanfang, gefolgt von http(s) oder www, gefolgt von beliebig vielen Zeichen mit Ausnahme von Leerraum bis Wortende.

Gruss, Marco


als Antwort auf: [#365419]

Grep-Suche nach Web- und Emailadressen

Rashid
Beiträge gesamt: 5

10. Sep 2008, 10:12
Beitrag # 3 von 7
Beitrag ID: #365514
Bewertung:
(8419 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Danke, genau das habe ich gesucht, die grepsuchen funktionieren einwandfrei! Vielen Dank.

MfG.

Rash


als Antwort auf: [#365431]

Grep-Suche nach Web- und Emailadressen

lowtone
Beiträge gesamt: 149

12. Mär 2009, 21:22
Beitrag # 4 von 7
Beitrag ID: #389179
Bewertung:
(8196 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Ja, auch ich danke, ich habe fast das Selbe gesucht.
Allerdings habe ich auch Webadressen im Dokument die ganz ohne www. oder http:// auskommen: hilfdirselbst.ch
Die von Marco vorgeschlagene Lösung findet außerdem www.albern oder http://œæ±&#8800;, die unter Garantie keine Domains sind.
Ich schlage daher folgendes vor:
Code
\<\S{3,}\.\l{2,3}\S*\> 


\< Wortanfang;
\S{3,} ein beliebiges Zeichen ohne Leerraum, dass mindestens 3 mal vorkommt (domains haben mindestens 3 Zeichen);
\. der Punkt, ohne den keine Webadresse auskommt
\l{2,3} nach dem Punkt kommen entweder 2 oder drei Kleinbuchstaben (es gibt keine Top-Level-Domains mit 1 oder 4+ Buchstaben, richtig?)
nach der TLD kann es aber noch weitergehen mit allem möglichen php-gedöns, deshalb: \S* kein oder mehrere Zeichen ohne Leerzeichen bis zum
\> Wortende

Als GREP-Frischling raucht mir jetzt gewaltig der Kopf!
Habe ich etwas übersehen? Oder zu kompliziert gemacht?
Ach, ja: Mailadressen werden gleich mitgesucht, das war ja Teil der Aufgabe.


als Antwort auf: [#365431]

Grep-Suche nach Web- und Emailadressen

Quarz
Beiträge gesamt: 3529

13. Mär 2009, 07:51
Beitrag # 5 von 7
Beitrag ID: #389213
Bewertung:
(8167 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Web- und eMailadressen-Sucher,

in:
Reguläre Ausdrücke
von Christian Wenz

wird anhand einer eMailadressensuche GREP aufgedröselt.

([+\-.\w])+@\w([-.\w])+\.\w{2,4}

Erläuterung:
1. Die eMail-Adresse beginnt mit einer beliebigen Anzahl von
Buchstaben, Ziffern, Unterstrich, Minus- und Pluszeichen.
2. dann folgt ein Klammeraffe.
3. Anschließend folgt der Domain-Name, der nur Buchstaben,
Ziffern und den Bindestrich enthalten darf. Außerdem sind
Punkte erlaubt, etwa bei Third-Level-Domains.
4. Abschließend kommt noch die Top-Level-Domain, die nur
aus Buchstaben besteht. Zwei sind Minimum. Momentan liegt
das Maximum bei vier Zeichen (z.B. .info)

Gruß
Quarz

------------------------
WinXP | CS4


als Antwort auf: [#389179]

Grep-Suche nach Web- und Emailadressen

Lars
Beiträge gesamt: 285

13. Mär 2009, 09:40
Beitrag # 6 von 7
Beitrag ID: #389230
Bewertung:
(8141 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo lowtone.

Antwort auf [ lowtone ] \S{3,} ein beliebiges Zeichen ohne Leerraum, dass mindestens 3 mal vorkommt (domains haben mindestens 3 Zeichen);


Es gibt auch einige Domains, die nur aus 2 Zeichen bestehen:
ix.de
hp.com
Mit de-TLD sind das aber nur eine handvoll Domains, die Bestandsschutz geniessen.

Antwort auf [ lowtone ] \l{2,3} nach dem Punkt kommen entweder 2 oder drei Kleinbuchstaben (es gibt keine Top-Level-Domains mit 1 oder 4+ Buchstaben, richtig?)


Es gibt keine TLD mit nur einem Buchstaben, wohl aber einige mit mehr als 4:
.museum
.travel
(siehe http://de.wikipedia.org/wiki/Top-Level-Domain)

Abgesehen davon sind Domains nicht case-sensitive, d.h. Groß-/Kleinschreibung wird nicht beachtet. Auf Kleinbuchstaben solltest du dich also nicht unbedingt festlegen ;)


als Antwort auf: [#389179]

Grep-Suche nach Web- und Emailadressen

lowtone
Beiträge gesamt: 149

13. Mär 2009, 11:27
Beitrag # 7 von 7
Beitrag ID: #389252
Bewertung:
(8124 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Ja, richtig. danke für die Antworten. Auf .info hätte ich natürlich selber kommen können …

Bei der Suche in dem Dokument ist mir außerdem aufgefallen, dass so hippe Ausdrücke wie quip.mainz [Migliedermagazin].[Orstname] auch gefunden werden.
Wenn ich so recht drüber nachdenke, kann GREP eben doch nicht alles: GREP kann nicht denken und selbstständig entscheiden. Und Webadressen ohne einheitliche Konventionen fehlerfrei zu finden scheint mir dann doch recht schwer. Oder irre ich mich?


als Antwort auf: [#389230]
X

Neuste Foreneinträge


Logo � Strich- Farbkombination wie anzulegen?

DokumentAufsplitten: neue Versionen des JavaScripts

Cookie-Overload??

Adobe InDesign CC - Windows (x64) GPU-Unterst�tzung �ber NVIDIA Control Panel

Kein Grep auf Satzzeichen am Ende einer URL

Text und QR Code in PDF einf�gen per PitStop Aktion statt InDesign

Bildschirmflackern beim Markieren von Texten

N�chstes Treffen der IDUG Stuttgart

Automatische Sicherung

PDF �ffnen via Script UI?