hilfdirselbst.ch
Facebook Twitter gamper-media
herrwind
Beiträge: 47
5. Dez 2013, 01:09
Beitrag #1 von 9
Bewertung:
(2383 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Hallo Leute,
ich brauche eure Hilfe. Mit diesem Code möchte ich die Staaten der Welt in meinem Text auszeichnen.
Hinter den Ländern habe ich noch was hingebastelt, damit der Dativ auch mit-ausgezeichnet wird (nicht immer passend, ich weiß).
Ich verstehe allerdings nicht, warum mir dieser Code scheinbar willkürich Wörter markiert.

Beispiel: Albania?\w+
Albania
? optional
\belieblig viele Wörter nach dem Wort

Code
(?i)Afghanistan?\w+|Albania?\w+|Algeria?\w+|America?\w+|Andorra?\w+|Angola?\w+|Antigua and Barbuda?\w+|Argentina?\w+|Armenia?\w+|Australia?\w+|Austria?\w+|Azerbaijan?\w+|The Bahamas?\w+|Bahrain?\w+|Bangladesh?\w+|Barbados?\w+|Belarus?\w+|Belgium?\w+|Belize?\w+|Benin?\w+|Bermuda?\w+|Bhutan?\w+|Bolivia?\w+|Bosnia and Herzegovina?\w+|Botswana?\w+|Brazil?\w+|Brunei?\w+|Bulgaria?\w+|Burkina Faso?\w+|Myanmar?\w+|Burundi?\w+|Cambodia?\w+|Cameroon?\w+|Canada?\w+|Cape Verde?\w+|Central African Republic?\w+|Chad?\w+|Chile?\w+|China?\w+|Republic of China?\w+|Colombia?\w+|Comoros?\w+|Democratic Republic of the Congo?\w+|Republic of the Congo?\w+|Costa Rica?\w+|Côte d'Ivoire?\w+|Croatia?\w+|Cuba?\w+|Republic of Cyprus?\w+|Czech Republic?\w+|Denmark?\w+|Djibouti?\w+|Dominica?\w+|Dominican Republic?\w+|East Timor?\w+|Ecuador?\w+|Egypt?\w+|El Salvador?\w+|Equatorial Guinea?\w+|Eritrea?\w+|Estonia?\w+|Ethiopia?\w+|Fiji?\w+|Finland?\w+|France?\w+|Faroe Islands?\w+|Gabon?\w+|The Gambia?\w+|Georgia?\w+|Germany?\w+|Ghana?\w+|Greece?\w+|Grenada?\w+|Guatemala?\w+|Guinea?\w+|Guinea-Bissau?\w+|Guyana?\w+|Haiti?\w+|Holy See?\w+|Honduras?\w+|Hungary?\w+|Iceland?\w+|India?\w+|Indonesia?\w+|Iran?\w+|Iraq?\w+|Ireland?\w+|Israel?\w+|Italy?\w+|Ivory Coast?\w+|Jamaica?\w+|Japan?\w+|Jordan?\w+|Kazakhstan?\w+|Kenya?\w+|Kiribati?\w+|Korea?\w+|Korea, North?\w+|Korea, South?\w+|Kuwait?\w+|Kyrgyzstan?\w+|Laos?\w+|Latvia?\w+|Lebanon?\w+|Lesotho?\w+|Liberia?\w+|Libya?\w+|Liechtenstein?\w+|Lithuania?\w+|Luxembourg?\w+|Republic of Macedonia?\w+|Madagascar?\w+|Malawi?\w+|Malaysia?\w+|Maldives?\w+|Mali?\w+|Malta?\w+|Marshall Islands?\w+|Mauritania?\w+|Mauritius?\w+|Mexico?\w+|Federated States of Micronesia?\w+|Moldova?\w+|Monaco?\w+|Mongolia?\w+|Montenegro?\w+|Morocco?\w+|Mozambique?\w+|Myanmar?\w+|Namibia?\w+|Nauru?\w+|Nepal?\w+|Netherlands?\w+|New Zealand?\w+|Nicaragua?\w+|Nigeria?\w+|Niger?\w+|Niue?\w+|North Korea?\w+|Norway?\w+|Oman?\w+|Pakistan?\w+|Palau?\w+|Palestine?\w+|Panama?\w+|Papua New Guinea?\w+|Paraguay?\w+|Peru?\w+|Philippines?\w+|Poland?\w+|Portugal?\w+|Puerto Rico?\w+|Qatar?\w+|Romania?\w+|Russia?\w+|Rwanda?\w+|Saint Kitts and Nevis?\w+|Saint Lucia?\w+|Saint Vincent and the Grenadines?\w+|Samoa?\w+|San Marino?\w+|São Tomé and Príncipe?\w+|Saudi Arabia?\w+|Senegal?\w+|Serbia?\w+|Seychelles?\w+|Sierra Leone?\w+|Singapore?\w+|Slovakia?\w+|Slovenia?\w+|Solomon Islands?\w+|Somalia?\w+|South Africa?\w+|South Korea?\w+|South Sudan?\w+|Spain?\w+|Sri Lanka?\w+|Sudan?\w+|Suriname?\w+|Swaziland?\w+|Sweden?\w+|Switzerland?\w+|Syria?\w+|Taiwan?\w+|Tajikistan?\w+|Tanzania?\w+|Tatarstan?\w+|Thailand?\w+|Tibet?\w+|Togo?\w+|Tonga?\w+|Trinidad and Tobago?\w+|Tunisia?\w+|Turkey?\w+|Turkmenistan?\w+|Tuvalu?\w+|Uganda?\w+|Ukraine?\w+|United Arab Emirates?\w+|United Kingdom?\w+|United States?\w+|Uruguay?\w+|Uzbekistan?\w+|Vanuatu?\w+|Vatican City?\w+|Venezuela?\w+|Vietnam?\w+|Western Sahara?\w+|Yemen?\w+|Zaire?\w+|Zambia?\w+|Zimbabwe?\w+ 


Jetzt wurden mir aber scheinbar beliebige Wörter auch ausgezeichnet. Ich kann mir das nicht erklären. Worte wie
individual, indicated, percentage, Charges, permit, oder operation (aber ohne das o)?
Kann sich das jemand erklären?

//sorry für den anderen Beitrag, dieser hat sich verirrt und ich konnte ihn nicht löschen.
Top
 
X
Thomas Richard  M  p
Beiträge: 17614
5. Dez 2013, 13:15
Beitrag #2 von 9
Beitrag ID: #520604
Bewertung:
(2186 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Ich sehe jetzt auch nichts, was da in den Ausdruck nicht reingehört.

Ich würde im Ausschlussverfahren den Bandwurm mal stutzen und schauen, obs besser wird.
Vielleicht ist er zu lang und wird irgendwo mitten in einem Land gekappt, dann wird evtl. dessen erster Teil (Silbe) gefunden.

Andere Gegenprobe bzgl. der Länge des Ausdrucks: Wird Zimbabwe markiert?

Wenn ja, dann schafft ID auch den kompletten Bandwurm.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/
als Antwort auf: [#520573] Top
 
herrwind
Beiträge: 47
5. Dez 2013, 13:19
Beitrag #3 von 9
Beitrag ID: #520607
Bewertung:
(2183 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Antwort auf [ Thomas Richard ] Ich sehe jetzt auch nichts, was da in den Ausdruck nicht reingehört.

Ich würde im Ausschlussverfahren den Bandwurm mal stutzen und schauen, obs besser wird.
Vielleicht ist er zu lang und wird irgendwo mitten in einem Land gekappt, dann wird evtl. dessen erster Teil (Silbe) gefunden.

Andere Gegenprobe bzgl. der Länge des Ausdrucks: Wird Zimbabwe markiert?

Wenn ja, dann schafft ID auch den kompletten Bandwurm.

Leider wird Zimbabwe richtig angewandt. Kurios ist, dass Chapman markiert wird, sobald Chap geschrieben wurde.
»Chap« kommt aber innerhalb der Länder nie vor.
als Antwort auf: [#520604] Top
 
Thomas Richard  M  p
Beiträge: 17614
5. Dez 2013, 16:05
Beitrag #4 von 9
Beitrag ID: #520622
Bewertung:
(2128 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Dann hilft nur per Eingrenzen der Liste zu versuchen, herauszufinden wo der Bock sitzt.

Hast du es mal parallel mit dem von Martin empfohlenen FindChangeByList.jsx Script probiert?


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/
als Antwort auf: [#520607] Top
 
wiseloc
Beiträge: 37
5. Dez 2013, 16:25
Beitrag #5 von 9
Beitrag ID: #520628
Bewertung:
(2121 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Hallo herrwind,

nein, das ist nicht kurios. Als Beispiel:
Code
Chad?\w+ 


Das Fragezeichen bedeutet Null oder ein Vorkommen, also wird das interpretiert als
1. "Cha",
2. gefolgt von KEINEM oder einem "d",
3. gefolgt von ein oder mehrere Zeichen

Damit werden also alle Wörter, die mit "cha" beginnen, markiert, also "Chapman".
Entsprechend für "India?" also individual, indicated etc. etc.

Ich würde es in etwa so versuchen:
Code
\bChad\w*\b 


Viele Grüße
Wolfgang
als Antwort auf: [#520607] Top
 
herrwind
Beiträge: 47
5. Dez 2013, 16:33
Beitrag #6 von 9
Beitrag ID: #520631
Bewertung:
(2110 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Antwort auf [ wiseloc ] Hallo herrwind,

nein, das ist nicht kurios. Als Beispiel:
Code
Chad?\w+ 


Das Fragezeichen bedeutet Null oder ein Vorkommen, also wird das interpretiert als
1. "Cha",
2. gefolgt von KEINEM oder einem "d",
3. gefolgt von ein oder mehrere Zeichen

Damit werden also alle Wörter, die mit "cha" beginnen, markiert, also "Chapman".
Entsprechend für "India?" also individual, indicated etc. etc.

Ich würde es in etwa so versuchen:
Code
\bChad\w*\b 


Ah! Gut, wenn man der Überzeugung war, dass ?\w+ bedeudet, dass alles nach dem Staat variierbar ist, kommt man da nie drauf. Ich habe jetzt ein positives Lookbehind eingebaut und damit klappt es! Herzlichen Dank!
als Antwort auf: [#520628] Top
 
Thomas Richard  M  p
Beiträge: 17614
5. Dez 2013, 16:47
Beitrag #7 von 9
Beitrag ID: #520633
Bewertung:
(2101 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Antwort auf [ wiseloc ] nein, das ist nicht kurios. Als Beispiel:
Code
Chad?\w+ 

O weia... das hätt mir aber auffallen müssen, dass das Fragezeichen zum letzten Buchstaben des Landes gehört ... peinlich.


MfG

Thomas


Und wenn dir geholfen wurde, hilf uns, dies auch weiterhin zu können.
http://www.hilfdirselbst.ch/info/
als Antwort auf: [#520628] Top
 
herrwind
Beiträge: 47
14. Dez 2013, 00:11
Beitrag #8 von 9
Beitrag ID: #521028
Bewertung:
(1924 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Auf Wunsch von Kai R. will ich hier meine momentane Lösung zeigen. Danke für dein Hinweis zur Ergänzung des Threads!

Code
(Afghanistan|Albania|Algeria|America|Andorra|Angola|Antigua and Barbuda|Argentina|Armenia|Australia|Austria|Azerbaijan|The Bahamas|Bahrain|Bangladesh|Barbados|Belarus|Belgium|Belize|Benin|Bermuda|Bhutan|Bolivia|Bosnia and Herzegovina|Botswana|Brazil|Brunei|Bulgaria|Burkina Faso|Myanmar|Burundi|Cambodia|Cameroon|Canada|Cape Verde|Central African Republic|Chad|Chile|China|Republic of China|Colombia|Comoros|Democratic Republic of the Congo|Republic of the Congo|Costa Rica|Ivoire|Croatia|Cuba|Republic of Cyprus|Czech Republic|Denmark|Djibouti|Dominica|Dominican Republic|East Timor|Ecuador|Egypt|El Salvador|Equatorial Guinea|Eritrea|Estonia|Ethiopia|Fiji|Finland|France|Faroe Islands|Gabon|The Gambia|Georgia|Germany|Ghana|Greece|Grenada|Guatemala|Guinea|Guinea-Bissau|Guyana|Haiti|Holy See|Honduras|Hungary|Iceland|India|Indonesia|Iran|Iraq|Ireland|Israel|Italy|Ivory Coast|Jamaica|Japan|Jordan|Kazakhstan|Kenya|Kiribati|Korea|Korea, North|Korea, South|Kuwait|Kyrgyzstan|Laos|Latvia|Lebanon|Lesotho|Liberia|Libya|Liechtenstein|Lithuania|Luxembourg|Republic of Macedonia|Madagascar|Malawi|Malaysia|Maldives|Mali|Malta|Marshall Islands|Mauritania|Mauritius|Mexico|Federated States of Micronesia|Moldova|Monaco|Mongolia|Montenegro|Morocco|Mozambique|Myanmar|Namibia|Nauru|Nepal|Netherlands|New Zealand|Nicaragua|Nigeria|Niger|Niue|North Korea|Norway|Oman|Pakistan|Palau|Palestine|Panama|Papua New Guinea|Paraguay|Peru|Philippines|Poland|Portugal|Puerto Rico|Qatar|Romania|Russia|Rwanda|Saint Kitts and Nevis|Saint Lucia|Saint Vincent and the Grenadines|Samoa|San Marino|São Tomé and Príncipe|Saudi Arabia|Senegal|Serbia|Seychelles|Sierra Leone|Singapore|Slovakia|Slovenia|Solomon Islands|Somalia|South Africa|South Korea|South Sudan|Spain|Sri Lanka|Sudan|Suriname|Swaziland|Sweden|Switzerland|Syria|Taiwan|Tajikistan|Tanzania|Tatarstan|Thailand|Tibet|Togo|Tonga|Trinidad and Tobago|Tunisia|Turkey|Turkmenistan|Tuvalu|Uganda|Ukraine|United Arab Emirates|United Kingdom|United States|Uruguay|Uzbekistan|Vanuatu|Vatican City|Venezuela|Vietnam|Western Sahara|Yemen|Zaire|Zambia|Zimbabwe)[b](\w+)? 

als Antwort auf: [#520573] Top
 
Kai Rübsamen  M  p
Beiträge: 4457
14. Dez 2013, 14:14
Beitrag #9 von 9
Beitrag ID: #521034
Bewertung:
(1885 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

GREP · Staaten auslesen


Was bedeutet denn das b am Ende deines Ausdrucks?
Code
Zimbabwe)[b](\w+)? 

Ich könnte mir vorstellen, dass dein Dokument am Ende durch solche Konstrukte sehr langsam wird u. würde solche Sachen am Schluß per S&E zuweisen, also kein GREP-Stil.

Gruß Kai Rübsamen
_______________________
als Antwort auf: [#521028]
(Dieser Beitrag wurde von Kai Rübsamen am 14. Dez 2013, 14:16 geändert)
Top
 
X