maveric
Goto Top

Regex versagt bei Klammern im String

Moin zusammen,

ich habe hier ein leichtes Skript, was jedoch einen winzigen Haken hat.

PROBLEM:
Wenn der Ausgangsstring z.b. "Paul hat einen Bart(Schneider) in seinem Auto" eine Klammer "(" beinhaltet,
wird der gesuchte String z.b. "Paul" oder "Auto" nicht mehr gefunden, obwohl er im Ausgangsstring vorhanden ist.

Wie man im Skript sehen kann, möchte ich, wenn noch nicht vorhanden in jede Produktbezeichnung und
Beschreibung die Energieeffzienz anfügen, sofern sie nicht schon vorhanden ist. Nur damit nicht jmd. noch
fragt wozu ich das bau Bärten und Autos brauche ;).

Ich habe in diesem Fall nur die Option für ein Shell-Skript, sonst hätte ich Perl genommen,
also wäre Vorschläge zu Shell Skripten gern gesehen :=)

Hier mal das Shell-Skript:

csv=meineCsv.csv

# x = Beschreibung(k) + Energieeffizienz (d)
# y = Produktbezeichnung(c) + Engergieeffizenz (d)
x=""  
y=""  

export IFS="|"  

cat $csv | while read a b c d e f g h i j k l m n;
do
        if [[ "$k" =~ "$d" ]]; then  
         x="$k";  
        else
         x="$k $d";  
        fi

        if [[ "$c" =~ "$d" ]]; then  
         y="$c";  
        else
         y="$c $d";  
        fi

        echo "$a|$b|$c|$d|$e|$f|$g|$h|$i|$j|$k|$l|$m|$n|$x|$y";  
done > ${csv}tmp

Viele Grüße
Maveric

Content-ID: 222404

Url: https://administrator.de/contentid/222404

Ausgedruckt am: 05.11.2024 um 02:11 Uhr

64748
64748 19.11.2013 um 20:42:43 Uhr
Goto Top
Hallo,

ich hab mal mit Deinem Ausgangsstring rumprobiert, ich kann nicht feststellen, dass das Matching des Satzes "Paul hat einen Bart(Schneider) in seinem Auto" nicht funktioniert. Hier meine Ausgabe:
markus@samsung:~$ cat paul.txt 
Paul hat einen Bart(Schneider) in seinem Auto
markus@samsung:~$ x=$(cat paul.txt); if [[ $x =~ "Paul" ]]; then echo "hallo"; fi
hallo
markus@samsung:~$ if [[ $x =~ "Auto" ]]; then echo "hallo"; fi
hallo
markus@samsung:~$ if [[ $x =~ "Audi" ]]; then echo "hallo"; fi
markus@samsung:~$ if [[ $x =~ "Schneider" ]]; then echo "hallo"; fi
hallo
markus@samsung:~$ if [[ $x =~ "schneider" ]]; then echo "hallo"; fi
markus@samsung:~$ if [[ $x =~ "(schn" ]]; then echo "hallo"; fi
markus@samsung:~$ if [[ $x =~ "\(schn" ]]; then echo "hallo"; fi
markus@samsung:~$ if [[ $x =~ "(Schn" ]]; then echo "hallo"; fi
hallo
markus@samsung:~$ if [[ "$x" =~ "(Schn" ]]; then echo "hallo"; fi
hallo
markus@samsung:~$ if [[ $x =~ "(Schn" ]]; then echo "hallo"; fi
hallo
Sowohl Wörter vor der Klammer, also auch zwischen Klammern und dahinter werden einwandfrei erkannt. Bist Du sicher, dass das Matching das Problem ist? Auch wenn man den Suchstring (z.B. Paul in eine Variable setzt d=Paul) funktioniert es einwandfrei.

Markus
Maveric
Maveric 19.11.2013 um 20:53:24 Uhr
Goto Top
Habe die Lösung gefunden...

Ja du hast recht, mein Beispiel funktioniert tadellos. Ich hatte ja geschrieben das ich mit Energieeffiziensklassen Arbeite also
"A+, A++" usw.

Der Fehler Tritt genau hier aut: if [[ "$k" =~ "$d" ]]; then

Der Rechte Ausdruck ist eine Regular Expression und in ihr Steht A+, A++ usw.
Ein "+" in Regex sagt aus, das ein oder mehr Zeichen im von dem Vorrangegangenem
Wort vorhanden sein müssen. Also hat der Zeile nach a oder aa oder aaa gesucht aber nicht nach "A+" oder "A++".

Das mit den Klammern bei den Spalten wo es nicht funktioniert hat war jetzt mal wieder
der beste Zufall überhaupt.

Die Lösung ist demensprechen, den Inhalt der Variable $d zu escapen. Z.b. so: fd=$(echo "$d" | sed -e 's/\+/\\+/g');

Und dann beim Matching dementsprechen if [[ "$k" =~ "$fd" ]]; then

Dann klappt auch alles.

Viele Grüße
Maveric