Powershell und REGEX
Hi @ All!
Und schon wieder hänge ich mal fest. Diesmal ist es eine Verständnisfrage mit REGEX wo ich nicht wirklich weiter komme:
Ich soll eine 4 Lichtjahre lange HTML (16 Mb groß!!!) nach einer variablen ID durchsuchen welche im HTML eine Überschrift repräsentiert. Alles was zwischen dieser und der Folgenden ID angegeben ist enthält Hostnames die sich auf diese ID beziehen. "Natürlich" gibt es keinen festen Bezug (Wenn ID dann Hostname, usw.) sondern es ist tatsächlich die Reihung das ausschlaggebende.
Dieses Problem ist bereits gelöst! Wo es wirklich hakt ist folgendes:
Ich matche auf die ID mit regex. Syntax:
Eine Zeile in der HTML wo REGEX matcht wäre: <h2 xmlns="" class="classsection4" id="idp68088064">73570 (1101) - Oracle Java SE Multiple Vulnerabilities (April 2014 CPU)</h2>
Nun will ich natürlich nicht die ganze Zeile, sondern nur das Matching ausgeben (in Folge in einer $Variable speichern und weiterverarbeiten) sprich: idp506922624. Irgendwie hakt's aber. Mein "HirnCompiler" schafft es nicht das Ergebnis umzudrehen, sprich: Speichere "nur" das Matching in der Variable
exemplarisch:
Gibt es da eventuell eine einfache Möglichkeit z.B. das matching zu "negieren" oder muss ich nun tatsächlich mit der Kirche um's Dorf rennen. Zum Testen verwende ich http://www.regexr.com/
bin für jeden Ansatz dankbar.
Grüße
Mayho
Und schon wieder hänge ich mal fest. Diesmal ist es eine Verständnisfrage mit REGEX wo ich nicht wirklich weiter komme:
Ich soll eine 4 Lichtjahre lange HTML (16 Mb groß!!!) nach einer variablen ID durchsuchen welche im HTML eine Überschrift repräsentiert. Alles was zwischen dieser und der Folgenden ID angegeben ist enthält Hostnames die sich auf diese ID beziehen. "Natürlich" gibt es keinen festen Bezug (Wenn ID dann Hostname, usw.) sondern es ist tatsächlich die Reihung das ausschlaggebende.
Dieses Problem ist bereits gelöst! Wo es wirklich hakt ist folgendes:
Ich matche auf die ID mit regex. Syntax:
Eine Zeile in der HTML wo REGEX matcht wäre: <h2 xmlns="" class="classsection4" id="idp68088064">73570 (1101) - Oracle Java SE Multiple Vulnerabilities (April 2014 CPU)</h2>
$test = Get-Content -Path "meine.html" -force
foreach ($item in $test) {
if ($item -match '(id[a-z]([0-9]{8,10}))') {
$item
}
}
Nun will ich natürlich nicht die ganze Zeile, sondern nur das Matching ausgeben (in Folge in einer $Variable speichern und weiterverarbeiten) sprich: idp506922624. Irgendwie hakt's aber. Mein "HirnCompiler" schafft es nicht das Ergebnis umzudrehen, sprich: Speichere "nur" das Matching in der Variable
exemplarisch:
$test = Get-Content -Path "meine.html" -force
foreach ($item in $test) {
if ($item -match '(id[a-z]([0-9]{8,10}))') {
$result = (Nur das matching)
}
}
Gibt es da eventuell eine einfache Möglichkeit z.B. das matching zu "negieren" oder muss ich nun tatsächlich mit der Kirche um's Dorf rennen. Zum Testen verwende ich http://www.regexr.com/
bin für jeden Ansatz dankbar.
Grüße
Mayho
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 242365
Url: https://administrator.de/forum/powershell-und-regex-242365.html
Ausgedruckt am: 02.04.2025 um 04:04 Uhr
5 Kommentare
Neuester Kommentar
wie oben geschrieben wird die Variable automatisch von PS erstellt und gefüllt, wenn man einen Match-Vergleich durchgeführt hat.
Quasi magisch