gutitm
Goto Top

Eigene Webseite überprüfen - nach Mailadressen

Hallo,

ich habe auf unser Webseite ein Problem mit Webcrawlern/Harvester, die wohl Mailadressen von der HP sammeln. Nun ist die seite recht gross und ich möchte nicht händisch alle Unterseiten nach Mailadressen durchgehen.

Gibt es ein Tool oder Webseite, welches meine Webseite nach erkennbaren Mailadressen durchsucht und die Seiten anzeigt. Dann könnte ich die Mailadressen entfernen. Habe sowas leider nicht im Web gefunden. Da gibt es vor allem Linkchecker und Codechecker.

Grüße gutit

Content-ID: 118471

Url: https://administrator.de/contentid/118471

Ausgedruckt am: 22.11.2024 um 10:11 Uhr

kimiko
kimiko 18.06.2009 um 11:39:41 Uhr
Goto Top
egrep -r '.*@.*.' /var/www
wget -r -O - |egrep '.*@.*.'

Perl, Ruby...: www::mechanize

gruss
Twlght667
Twlght667 18.06.2009 um 11:40:09 Uhr
Goto Top
Mit der Windows-Suche den Ordner nach *.* (oder *.htm, *.php, was auch immer...) durchsuchen. Als zu suchenden Inhalt "@" angeben. Sollte eigentlich funktionieren.
gutitm
gutitm 18.06.2009 um 13:26:21 Uhr
Goto Top
vielen Dank, mir geht es vor allem um die Suchmechanismen eines solchen Tools...z.Bsp. können die ja inzwischen auch @, [at], [@] und so weiter finden

@kimiko ...leider liegt die Webseite auf nem Host, wo ich keinen Zugriff per ssh habe bzw. Möglichkeiten grep auf der Kommandozeile zu benutzen...

@others

der Content der Webseite liegt in einer Datenbank (SQL, Webseite Typo3)...daher bin ich mir nicht sicher, ob ich das so einfach durchsuchen kann. daher auch die Frage nach einem Onlinedurchsuchen...

bis jetzt habe ich da nur halbwissen...
kimiko
kimiko 18.06.2009 um 13:47:44 Uhr
Goto Top
Vielleicht kann man ja nen cronjob laufen lassen.
Die regular expressions musst du dann natürlich anpassen.
andere Idee nimm die Waffen deiner Feinde, deine eigene Suchmaschiene:
yacy und indizier deine Site.
Damit kann man auch Dokumente pdf, zip... durchsuchen.
Das ist auch schnell und einfach installiert.
gutitm
gutitm 18.06.2009 um 13:52:16 Uhr
Goto Top
Cronjob müsste gehen.

Du meinst die eigene suchmaschine für die seite? Ist ja ne gute Idee....gibt das Ganze ja auch "powered by google" bzw. für Typo3 als plugin?

Und die Waffen meiner Feinde will ich mir anschauen face-smile
60730
60730 18.06.2009 um 15:36:04 Uhr
Goto Top
Zitat von @gutitm:
Und die Waffen meiner Feinde will ich mir anschauen face-smile

Servus,

dazu müßtest du aber ins Lager der "Feinde" wechseln und sei dir sicher...

  • Die erkennen "Trojaner" sofort.. - du brauchst einen Leumund, um reinzukommen
  • Hier gibts keinen Link.

Gruß
gutitm
gutitm 22.06.2009 um 15:13:29 Uhr
Goto Top
So krass meinte ich das jetzt nicht. Habe mir erstmal Yacy installiert, scheint dafür gut geeignet zu sein. Muss nur noch eine Art Volltextsuche finden...