interface31
Goto Top

Regular expressions tool oder python ?

Hi,

habe tausende files und möchten nun aus diesen nun die Telefonnr. ausfiltern.
Mit dnGrep geht dies auch eine Zeit ganz gut aber ab ca. 500 files kommen Fehler zustande.
Hat jemand ein gutes stabiles tool oder ein python script?

cu

Content-Key: 2219321153

Url: https://administrator.de/contentid/2219321153

Printed on: April 25, 2024 at 00:04 o'clock

Member: cykes
cykes Mar 19, 2022 at 11:26:54 (UTC)
Goto Top
Zitat von @interface31:
habe tausende files und möchten nun aus diesen nun die Telefonnr. ausfiltern.
Also jpegs, wavs, mp3s, cdr usw.? Oder wolltest Du uns das/die Dateiformat(e) noch verraten?
Mit dnGrep geht dies auch eine Zeit ganz gut aber ab ca. 500 files kommen Fehler zustande.
Hat jemand ein gutes stabiles tool oder ein python script?
awk, egrep, perl - such Dir was aus. Der Informationsgehalt Deiner Frage ist etwas dürftig.
Sowas findet man auch gut im Netz, gerade in Bezug auf Telefonnummern.

Gruß

cykes
Mitglied: 1915348599
1915348599 Mar 19, 2022 updated at 12:11:52 (UTC)
Goto Top
Hmm also das gute alte grep erledigt das eigentlich hervorragend auch mit tausenden Files rekursiv in null komma nix ...
z.B.
grep -Ehrao '\+49\[0-9]+' /path/*  
aber ab ca. 500 files kommen Fehler zustande.
Was für Fehler?? Mit Grep habe ich gerade in ner Minute mal schnell 1Mio Files durchsuchen lassen ohne irgendwelche unbekannte "Fehler".
Member: cykes
cykes Mar 19, 2022 updated at 12:36:42 (UTC)
Goto Top
Ich vermute ja, dass er was für Windows zum Mausschubsen sucht (wegen des erwähnten dngrep) , aber ich wollte ja nicht raten 😄

Geht auch noctfalls in Powershell -> https://docs.microsoft.com/de-de/powershell/module/microsoft.powershell. ... und in Python auch -> https://www.w3schools.com/python/python_regex.asp

Natürlich nur, wenn RegEx-Kenntnisse vorhanden sind.
Mitglied: 1915348599
1915348599 Mar 19, 2022 updated at 15:46:57 (UTC)
Goto Top
Jepp ein Einzeiler würde da ebenfalls reichen bspw.
Select-String "D:\Ordner\*.txt" -Pattern "\+49\d+" -Allmatches | %{$_.Matches.Value}  
Natürlich nur, wenn RegEx-Kenntnisse vorhanden sind.
Jepp davon gehe ich hoffentlich aus wenn man das schon im Titel verwendet. 🤞
Member: interface31
interface31 Mar 20, 2022 at 19:56:35 (UTC)
Goto Top
Hi,
sind HTML files.
dnGrep schmeißt nach einigen Files alles rein auch was gar nicht dazu paßt.
Wenn ich es splitet geht es gut.
Bin mehr auf dem Mac unterwegs, dnGrep ist mir halt aufgrund des speichern der Ergebnisse sympathisch.
Schau mir es mal an, Danke!