Diverser Vergleich einer undefinierten Zeichenfolge abragen Powershell bzw. Oracle SQL
Hallo Community,
ich bin an einer Auswertung von verschiedenen Artikeln aus unserer Datenbank
und müsste einen Vergleich einer Liste durchführen, der folgendes macht:
Wir haben mehrer Artikel, die die gleiche Bezeichnung, jedoch eine andere Größe besitzen.
Z.B.
H07V-K 1x1,5 GR
H07V-K 1x1,5 SW
H07V-K 1x1,5 OR
H07V-K 1x1,5 WS
H07V-K 1x1,5 GG
H07V-K 1x2,5 GR
H07V-K 1x2,5 SW
H07V-K 1x2,5 OR
H07V-K 1x2,5 WS
H07V-K 1x2,5 GG
NYY-J 3X1,5RM
NYY-J 3X1,5RE
NYY-J 3X2,5RM
NYY-J 3X2,5RE
etc.
Also es gibt immer mehrere gleiche Bezeichnungen.
Dieses Muster kommt jedoch sehr oft vor. Sprich ich suche nach einem Vergleichsoperater, dem ich zuvor nicht sagen muss,
nach welchem Ausgangswert er suchen soll.
TrimEnd, um nur die Enden zu kürzen bringt nur bei den ersten beiden Artikelgruppen etwas, bei den restlichen jedoch nicht.
Mit -Match Sucher oder Group-Object, funktioniert es auch nicht. Bei Match, muss man ja einen Ausgangswert angeben
und Group-Object funktioniert auch nicht, da zwar der Teil "H07V-K" oft vorkommt, der Teil 1x1,5 am Ende jedoch immer variiert.
Gibt es hier vielleicht etwas, um eine Suche durchzuführen die da etwa lautet:
Scanne die ganze List, schaue welche Zeichenfolgen ungefähr öfters vorkommen und gib mir an, wie oft dies vorkommt.
Möglichkeit neben Powershell liegt noch in Oracle SQL.
Vielen vielen Dank im Voraus!
Viele Grüße
Kraehahn
ich bin an einer Auswertung von verschiedenen Artikeln aus unserer Datenbank
und müsste einen Vergleich einer Liste durchführen, der folgendes macht:
Wir haben mehrer Artikel, die die gleiche Bezeichnung, jedoch eine andere Größe besitzen.
Z.B.
H07V-K 1x1,5 GR
H07V-K 1x1,5 SW
H07V-K 1x1,5 OR
H07V-K 1x1,5 WS
H07V-K 1x1,5 GG
H07V-K 1x2,5 GR
H07V-K 1x2,5 SW
H07V-K 1x2,5 OR
H07V-K 1x2,5 WS
H07V-K 1x2,5 GG
NYY-J 3X1,5RM
NYY-J 3X1,5RE
NYY-J 3X2,5RM
NYY-J 3X2,5RE
etc.
Also es gibt immer mehrere gleiche Bezeichnungen.
Dieses Muster kommt jedoch sehr oft vor. Sprich ich suche nach einem Vergleichsoperater, dem ich zuvor nicht sagen muss,
nach welchem Ausgangswert er suchen soll.
TrimEnd, um nur die Enden zu kürzen bringt nur bei den ersten beiden Artikelgruppen etwas, bei den restlichen jedoch nicht.
Mit -Match Sucher oder Group-Object, funktioniert es auch nicht. Bei Match, muss man ja einen Ausgangswert angeben
und Group-Object funktioniert auch nicht, da zwar der Teil "H07V-K" oft vorkommt, der Teil 1x1,5 am Ende jedoch immer variiert.
Gibt es hier vielleicht etwas, um eine Suche durchzuführen die da etwa lautet:
Scanne die ganze List, schaue welche Zeichenfolgen ungefähr öfters vorkommen und gib mir an, wie oft dies vorkommt.
Möglichkeit neben Powershell liegt noch in Oracle SQL.
Vielen vielen Dank im Voraus!
Viele Grüße
Kraehahn
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 346239
Url: https://administrator.de/contentid/346239
Ausgedruckt am: 19.11.2024 um 17:11 Uhr
4 Kommentare
Neuester Kommentar
und Group-Object funktioniert auch nicht, da zwar der Teil "H07V-K" oft vorkommt, der Teil 1x1,5 am Ende jedoch immer variiert.
Du scheinst nicht zu wissen daß du bei group-object auch geschweifte Klammern ({}) und Regex für eine Gruppierung verwenden kannst .Und bei Regex braucht man keinen festen Begriff sondern arbeitet mit Mustern. Wobei es hier möglicherweise ausreicht einen Split am Leerzeichen zu machen wenn alle Artikel auf diesem Muster wie ml oben basieren.
Gruß
Wenn du überhaupt keine Liste mit Mustern hast, ist das fast nicht möglich oder wenn dann nicht 100% zuverlässig, denn wer kann schon erraten welche Artikel zusammengehören wenn sich die Bezeichnungen mal mehr unterscheiden du müsstest also sowieso alle Artikel zumindest nachkontrollieren. Was man machen kann ist ein Änlichkeitsvergleich (Levenshtein-Distanz) bei dem man definiert wie viele Buchstaben sich max. ändern dürfen wenn man zwei Namen vergleicht, das wäre noch machbar. Dafür gibt es schon Powershell-Funktionen.
Warum, wenn das 10000 Artikel sind, wurden die Artikel nicht mit Fremdschlüssel versehen der die Gruppe definiert? Welcher Hempel macht denn heute noch sowas?? Anfänger ohne Datenbankerfahrung?!
Warum, wenn das 10000 Artikel sind, wurden die Artikel nicht mit Fremdschlüssel versehen der die Gruppe definiert? Welcher Hempel macht denn heute noch sowas?? Anfänger ohne Datenbankerfahrung?!