interface31
Goto Top

Regular expressions tool oder python ?

Hi,

habe tausende files und möchten nun aus diesen nun die Telefonnr. ausfiltern.
Mit dnGrep geht dies auch eine Zeit ganz gut aber ab ca. 500 files kommen Fehler zustande.
Hat jemand ein gutes stabiles tool oder ein python script?

cu

Content-ID: 2219321153

Url: https://administrator.de/contentid/2219321153

Ausgedruckt am: 21.11.2024 um 20:11 Uhr

cykes
cykes 19.03.2022 um 12:26:54 Uhr
Goto Top
Zitat von @interface31:
habe tausende files und möchten nun aus diesen nun die Telefonnr. ausfiltern.
Also jpegs, wavs, mp3s, cdr usw.? Oder wolltest Du uns das/die Dateiformat(e) noch verraten?
Mit dnGrep geht dies auch eine Zeit ganz gut aber ab ca. 500 files kommen Fehler zustande.
Hat jemand ein gutes stabiles tool oder ein python script?
awk, egrep, perl - such Dir was aus. Der Informationsgehalt Deiner Frage ist etwas dürftig.
Sowas findet man auch gut im Netz, gerade in Bezug auf Telefonnummern.

Gruß

cykes
1915348599
1915348599 19.03.2022 aktualisiert um 13:11:52 Uhr
Goto Top
Hmm also das gute alte grep erledigt das eigentlich hervorragend auch mit tausenden Files rekursiv in null komma nix ...
z.B.
grep -Ehrao '\+49\[0-9]+' /path/*  
aber ab ca. 500 files kommen Fehler zustande.
Was für Fehler?? Mit Grep habe ich gerade in ner Minute mal schnell 1Mio Files durchsuchen lassen ohne irgendwelche unbekannte "Fehler".
cykes
cykes 19.03.2022 aktualisiert um 13:36:42 Uhr
Goto Top
Ich vermute ja, dass er was für Windows zum Mausschubsen sucht (wegen des erwähnten dngrep) , aber ich wollte ja nicht raten 😄

Geht auch noctfalls in Powershell -> https://docs.microsoft.com/de-de/powershell/module/microsoft.powershell. ... und in Python auch -> https://www.w3schools.com/python/python_regex.asp

Natürlich nur, wenn RegEx-Kenntnisse vorhanden sind.
1915348599
1915348599 19.03.2022 aktualisiert um 16:46:57 Uhr
Goto Top
Jepp ein Einzeiler würde da ebenfalls reichen bspw.
Select-String "D:\Ordner\*.txt" -Pattern "\+49\d+" -Allmatches | %{$_.Matches.Value}  
Natürlich nur, wenn RegEx-Kenntnisse vorhanden sind.
Jepp davon gehe ich hoffentlich aus wenn man das schon im Titel verwendet. 🤞
interface31
interface31 20.03.2022 um 20:56:35 Uhr
Goto Top
Hi,
sind HTML files.
dnGrep schmeißt nach einigen Files alles rein auch was gar nicht dazu paßt.
Wenn ich es splitet geht es gut.
Bin mehr auf dem Mac unterwegs, dnGrep ist mir halt aufgrund des speichern der Ergebnisse sympathisch.
Schau mir es mal an, Danke!