psar04
Goto Top

Common Name (CN) in String suchen und ausgeben

Hallo,

ein Bisschen Hintergrundwissen (für die eigentliche Frage nicht unbedingt notwendig):
Ich betreibe OpenVPN auf einem Router mit DD-Wrt-Firmware und möchte die "tls-verify"-Option nutzen, um festzulegen mit welchen Zertifikaten ein Zugriff möglich ist. Hierzu werden von OpenVPN Zertifikatsinformationen an ein Skript übergeben, welches überprüft, ob der Client Zugriff bekommt oder nicht. Die Entscheidung ja/nein wird OpenVPN dann per Return-Code mitgeteilt.

Im Netz habe ich bereits ein Shell-Skript gefunden, so wie ich mir das vorstelle: http://robert.penz.name/21/ovpncncheck-an-openvpn-tls-verify-script/

Leider passt die Regular Expression bei mir nicht.

Übergeben werden Zertifikatsinformationen, die etwa so aussehen:

C=DE, ST=North Rine-Westphalia, L=Stadt, O=Martin Muster, OU=IT, CN=Max Muster, emailAddress=max@muster.com

Für eine Überprüfung wird nur der Common Name (also alles zwischen "CN=" und ",emailAddress=....") benötigt.


Wie erhalte ich den Wert des CN? Ich habe schon ein paar Stunden probiert, bin aber noch nicht zum Ziel gekommen. Bisher habe ich folgende RegEx, bei der zumindest die Mailadresse nicht mehr mit ausgegeben wird: '.*CN=([^,]*)'

Aufgrund der Betriebsumgebung kann nur mit der Linux-Shell und Standard-Tools wie grep gearbeitet werden, Python oder ähnliches steht nicht zur Verfügung.

Gruß
PSaR04

Content-ID: 218694

Url: https://administrator.de/contentid/218694

Ausgedruckt am: 22.11.2024 um 16:11 Uhr

Endoro
Endoro 07.10.2013 um 19:49:32 Uhr
Goto Top
Hi, ich hab kein Python am Laufen, aber mit sed geht das:
.*CN=([^,]*).*
lg.
PSaR04
PSaR04 07.10.2013 aktualisiert um 20:04:51 Uhr
Goto Top
Zitat von @Endoro:
Hi, ich hab kein Python am Laufen, aber mit sed geht das:
.*CN=([^,]*).*
lg.

Hi,

danke für den Tipp. Ich habe jetzt mal folgendes gemacht:

echo $t | sed '.*CN=([^,]*).*'

Aber dann wird gar nichts ausgegeben. In $t steckt übrigens der übergebene String.
Endoro
Endoro 07.10.2013 aktualisiert um 20:21:30 Uhr
Goto Top
Hi, der geklammerte Teil vom String muss ja wieder in den replace pattern:
echo $t | sed -r 's/.*CN=([^,]*).*/\1/'  
Getestet mit GNU sed.
lg.
PSaR04
PSaR04 07.10.2013 um 20:27:59 Uhr
Goto Top
Zitat von @Endoro:
Hi, der geklammerte Teil vom String muss ja wieder in den replace pattern:
> echo $t | sed -r 's/.*CN=([^,]*).*/\1/'  
> 
Getestet mit GNU sed.
lg.

Perfekt, so läufts!

Vielen, vielen Dank. Da habe ich jetzt schon ewig dran gesessen...
PSaR04
PSaR04 07.10.2013 um 20:53:00 Uhr
Goto Top
Bekommt man es auch noch hin, dass der vollständige CN ausgegeben wird, wenn ein Komma darin steckt? Z. B. folgendem String:

C=DE, ST=North Rine-Westphalia, L=Stadt, O=Martin Muster, OU=IT, CN=Muster, Max, emailAddress=max@muster.com


Ich hätte gedacht, die RegEx noch ein Bisschen zu erweitern, z. B. so:

echo $t | sed -r 's/.*CN=(([^a-z]+[^A-Z]+[^=])*).*/\1/'

Mir wird dann aber nur "Muster, " ausgegeben, der Rest fehlt.
Endoro
Endoro 08.10.2013 aktualisiert um 02:31:04 Uhr
Goto Top
Hi, wenn in den Daten neue Muster auftauchen, muss Regex halt angepasst werden.
ZB so:
| sed -r 's/.*CN=(.*),\s?email.*/\1/'  
Vor allem da das Komma ja ein wichtiger Anker im vorherigen Regex war.
Und hier auch wieder ist. Es ginge deshalb auch so, was mir fast noch besser gefällt:
| sed -r 's/.*CN=([[:alnum:]]+,?\s[[:alnum:]]+),?\s.*/\1/'  
Das geht davon aus, dass CN immer zwei Wörter sind.
lg.
PSaR04
PSaR04 08.10.2013 um 14:23:31 Uhr
Goto Top
Zitat von @Endoro:
Hi, wenn in den Daten neue Muster auftauchen, muss Regex halt angepasst werden.
ZB so:
| sed -r 's/.*CN=(.*),\s?email.*/\1/'  
Vor allem da das Komma ja ein wichtiger Anker im vorherigen Regex war.
Und hier auch wieder ist. Es ginge deshalb auch so, was mir fast noch besser gefällt:
| sed -r 's/.*CN=([[:alnum:]]+,?\s[[:alnum:]]+),?\s.*/\1/'  
Das geht davon aus, dass CN immer zwei Wörter sind.
lg.

Danke dafür, aber leider wird bei beiden der komplette String ausgegeben..
Endoro
Endoro 08.10.2013 um 16:58:20 Uhr
Goto Top
Hi, welche sed Version verwendest du?
GNU sed version 4.2.1
lg.
PSaR04
PSaR04 08.10.2013 um 19:08:59 Uhr
Goto Top
Folgendes wird mir nach Eingabe von "sed --version" angezeigt: This is not GNU sed version 4.0
Endoro
Endoro 08.10.2013 um 19:54:14 Uhr
Goto Top
Ist ja witzig face-smile

Hier noch ein Vorschlag. Nicht -r vergessen und statt -r auch mal -E testen.
|sed -r 's/.*CN=(\S+\s\w+),.+/\1/'  

oder mit POSIX-Klassen:
| sed -E 's/.*CN=([^[:space:]]+[[:space:]][[:alpha:]]+),.+/\1/'  
lg.
PSaR04
PSaR04 08.10.2013 um 21:59:52 Uhr
Goto Top
Zitat von @Endoro:
Ist ja witzig face-smile

Hier noch ein Vorschlag. Nicht -r vergessen und statt -r auch mal -E testen.
> |sed -r 's/.*CN=(\S+\s\w+),.+/\1/'  
> 

oder mit POSIX-Klassen:
> | sed -E 's/.*CN=([^[:space:]]+[[:space:]][[:alpha:]]+),.+/\1/'  
> 
lg.

Beim 1. Vorschlag wird wieder der komplette String ausgegeben. Beim 2. hat er dann das -E mit "Invalid Option" angemeckert. Dann habe ich den 2. noch mit -r ausprobiert und....oh Wunder auf einmal klappte es.
Leider war die erste Freude schnell wieder ein kleines Bisschen getrübt, wenn nämlich mehrere Kommas im CN vorkamen, wurde immer nur der Text bis zum 2. Komma ausgegeben face-sad
Also musste ich erstmal deine Idee etwas interpretieren, da mir nicht gleich alles auf Anhieb klar war. Das Zuvor beschriebene Problem konnte ich dann lösen, indem ich ":alpha:" gegen ":print:" getauscht und das ganze Konstrukt, da es ja mehrfach vorkommen kann in Klammern gepackt und mit + ergänzt habe. Nur blöd, wenn der CN dann nur aus einem einzelnen Wort besteht, also mittels "|" noch eine weitere Möglichkeit angegeben.

Rausgekommen ist dabei folgendes:
echo $t | sed -r 's/.*CN=([^[:space:]]+([[:space:]][[:print:]]+)+|([[:print:]])+),.+/\1/'
Zugegeben, ganz perfekt ist es noch nicht. Wenn z. B. mehrere Leerzeichen hintereinander stehen wird in der Ausgabe nur eins angezeigt und bei einigen speziellen Zeichen kann es auch mal zu einem Fehler kommen. Damit kann ich aber erstmal leben, nichts desto trotz: Falls jemand noch die "ultimative Lösung" haben sollte, würde ich mich sehr darüber freuen.
Besonderer Dank geht nochmal an Endoro.
Endoro
Endoro 09.10.2013 um 00:24:42 Uhr
Goto Top
Hi,
wenn du häufiger mit sed arbeitest, solltest du dir eine aktuelle GNU-Version besorgen. Vielleicht ist die auch schon installiert und wird nur nicht benutzt.
Hier noch ein abschliessender Vorschlag, der alle Leerzeichen und Kommas zwischen den Namen erhält und auch mit einem Namen klar kommt:
|sed -r 's/.*CN=([^[:space:]]+[[:space:],]*[^[:space:],]*),+.+/\1/'  
lg.