chrisfah
Goto Top

Regex Ausdruck für mehrere Urls

Hallo, ich benötige wieder mal Hilfe. Ich suche einen passenden regex Ausdruck für eine bestimmte Url Struktur einer Site..

Die folgenden Url-Strukturen solen mit einem Regex Ausdruck erfasst werden,
leider komm ich nicht zu dem gewünschten Ergebnis

Unterstützt müssen folgende Urls werden:


www.domain.com = root
www.domain.com/de = root mit gewählter Sprache( alternativ auch fr, it usw.)
www.domain.com/de/ = root mit gewählter Sprache
www.domain.com/de/function/name_der_funktion/123 = funkttionen wie Login usw.
www.domain.com/de/admin/name_der_adminfunktion/123 = diverse Admin Seiten
www.domain.com/de/account/name_der_accountfunktion/123 = diverse Account Seiten der user
www.domain.com/de/Kategoriename/12345 = kategorieseite
www.domain.com/de/kategoriename/Artikelname/12345,98765 = Artikelseite, wobei 12345 = KategorieID und 98765 = ArtikelID

Ausser bei der root Seite kommt überall die Sprache dazu.
Wichtig sind folgende Teile der Url:
de = Sprachauswahl
function|admin|account zusammen mit der Zahl am Ende der Url (= bestimmt die eigentliche Funktion)
Die Zahl bei Kategorieseiten ergibt die KategorieID (der text davor ist egal)
Die Zahlen bei Artikelseiten ergeben die Artikel ID (der text davor ist egal)
Die texte bzw. Namen der Funktionen dazwischen sing egal.

leider bekomm ich es nicht hin, daß die Zahlen, sofern vorhanden, immer in ein und er selben $match-Gruppe stehen (zB $macht[4])eine nichtgenutzte leer bleibt. Mein bisheriger Ansatz sieht so aus:

preg_match("#^\/([de|fr|it]{2})?\/?([\w\-]*)\/?([\w\-]*)?\/?([\d]+,?[\d]*)?$#i", $_SERVER['REQUEST_URI'], $match);

Wer kann mir da weiterhelfen?

Lg, ChrisFah

Content-ID: 202240

Url: https://administrator.de/contentid/202240

Ausgedruckt am: 25.11.2024 um 04:11 Uhr

64748
64748 23.02.2013 aktualisiert um 15:18:24 Uhr
Goto Top
Hallo,

erster Punkt der mir auffällt ist folgender
[de|fr|it]
findet nicht de oder fr oder it sondern Zeichenfolgen wie dfi, eft usw.
[de|fr|it] bedeutet eines der beiden Zeichen 'd' oder 'e' oder eines der beiden Zeichen 'f' oder 'r' usw.

Du meinst vermutlich (de|fr|it)

Und bitte erklär mal genauer, welchen output Du erwartest. Welche Datenstruktur soll denn die extrahierten Daten enthalten?

Markus

Korrektur: der Code ([de|fr|it]{2}) findet tatsächlich die Zeichenfolgen de, fr und it, der Fehler ist aber, dass er auch Zeichenfolgen wie dd, ee, ff usw. findet.
colinardo
colinardo 23.02.2013 aktualisiert um 14:31:19 Uhr
Goto Top
Hi ChrisFah,
wie wäre es wenn du "named groups" verwendest ? In deinem Beispiel würde die Regex z.B. so aussehen:
"#^\/(?P<language>de|fr|it)?\/?(?P<hauptfunktion>[\w\-]*)?\/?(?P<unterfunktion>[\w\-]*)?\/?(?P<numbers_part1>[\d]+)?,?(?P<numbers_part2>[\d]*)?$#i"
Dann kannst du auf die jeweiligen Gruppen in dieser Art zugreifen:
$match['language']
$match['hauptfunktion']
$match['unterfunktion']
$match['numbers_part1']
$match['numbers_part2']
Eine named group wird nach folgendem Schema erstellt:
(?P<GRUPPENNAME>.....)
Das sollte dein Problem lösen.
p.s. Ein Programm das bei Regex-Problemen sehr gute Unterstützung bietet -> RegexBuddy face-wink

Grüße Uwe
ChrisFah
ChrisFah 23.02.2013 um 15:33:28 Uhr
Goto Top
Hallo, stimmt, das sollte in () stehen. Der colinario hat mir die Lösung bereits perfekt geliefert. So klappt es wie ich es wollte.
Danke für Deine Mühe !!!
Lg, ChrisFah
ChrisFah
ChrisFah 23.02.2013 um 15:36:16 Uhr
Goto Top
@colinaro:
Hallo, danke für Deine Mühe und den Tipp.
Ich habs so gelöst:
"#^\/(?P<language>de|fr|it)?\/?(?P<function>admin|fn|my|content)?\/?(?P<text>[\w\-]*)?\/?(?P<id_1>[\d]+)?,?(?P<id_2>[\d]*)?$#i"

Klappt perfekt! Danke, ChrisFah