Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

HTML - Dateien nach bestimmten Strings auslesen und in Textdatei speichern?

Mitglied: n0000b

n0000b (Level 1) - Jetzt verbinden

19.02.2012 um 20:34 Uhr, 6947 Aufrufe, 14 Kommentare

ich kenne mich mit der batch-Programmierung leider nicht aus.

Hallo,

folgendes Problem:
Ich habe in einem Ordner ca. 2000 HTML-Dateien. In jeder Datei steht folgendes (im Quelltext):

name="benutzer" value="blablabla"
name="passwort" value="xxxxxxxxxx"
name="mail" value="dasisteinemail@hier.de"

Ich müsste die Informationen jetzt wie folgt in einer Textdatei haben:

blablabla:xxxxxxxxxx:dasisteinemail@hier.de


Ist das möglich, wenn ja wie?
Mitglied: pieh-ejdsch
19.02.2012 um 21:28 Uhr
moin n0000b und Willkommen in Forum,

na das könnte in etwa so gehen:
ungetestet, daher ohne @echo off
[Edit]
EingabeUmleitung von nul auf die richtige For gelegt.
[/Edit]

[Edit2]
Man war das eine Geburt ...
... das klappt nur wenn eine Zeile nach dem Echo( in der Sub ist!
[/Edit]

Gruß Phil
Bitte warten ..
Mitglied: bastla
19.02.2012 um 22:03 Uhr
@PH
Sehr schön - vielleicht noch etwas übersichtlicher (und mit ":" im Ergebnis ):
Grüße
bastla

[Edit] "if ..." angepasst [/Edit]
Bitte warten ..
Mitglied: pieh-ejdsch
19.02.2012 um 22:07 Uhr
moin bastla,

mit = kann ich nicht "ausToken" (mail) ich habs nun doch mit " gemacht/berichtigt

Gruß Phil
Bitte warten ..
Mitglied: bastla
19.02.2012 um 22:13 Uhr
Hallo PH!

Sollte aber doch (wie in meiner angepassten Version) zu machen sein ...

Grüße
bastla
Bitte warten ..
Mitglied: pieh-ejdsch
19.02.2012 um 22:24 Uhr
Ahh,

da stach mir das mail zu sehr in die Augen und hab dadurch " value nicht "gesehen".

Gruß Phil
Bitte warten ..
Mitglied: n0000b
19.02.2012 um 23:25 Uhr
Hallo,
die Lösungen funktionieren irgenwie nicht. Eine Datei wird erstellt, diese ist aber leer.
Der Quelltext der HTML Dateien ist natürlich noch größer als der von mir oben erwähnte Ausschnitt.
Aber um den oben erwähnten Ausschnitt geht es.
Habe die Datei entsprechend angepasst (Ort der Dateien, Speichertort der Ausgabe-Text)
Bitte warten ..
Mitglied: rubberman
19.02.2012 um 23:50 Uhr
Hallo Zusammen.

Ich habe es mir absichtlich verkniffen ...

@n0000b

Eine HTML Datei
- kann eine Zeichenkodierung haben, die so ohne Weiteres nicht geeignet ist, per Batch verarbeitet zu werden
- kann aus Zeilen oder einer einzigen Zeile (also ohne Zeilenumbruch) bestehen, die für Batch viel zu lang sind, um verarbeitet zu werden

In einer HTML Datei
- kommen Werte, wie du sie oben genannt hast, sicher innerhalb irgendwelcher Tags vor
- können diese Tags wiederum innerhalb einer Zeile aneinander gereiht sein

Wenn du dein Beispiel mal dahingehend konkretisieren würdest, wie du es tatsächlich vorfindest ...

Grüße
rubberman
Bitte warten ..
Mitglied: n0000b
20.02.2012 um 00:17 Uhr
Die Dateien bestehen aus vielen Zeilen...>400

Der o.g. Ausschnitt findet sich in den Dateien wieder in:

<div class="section" id="pane0">
<table cellspacing="0" cellpadding="0" border="0" width="100%">

<tr><td><table><tr>


Ein Bsp. wäre:
<tr>
<td class="subhead" bgcolor="#000000">Benutzer</td><td><input size="32" type="text" autocomplete="off" name="benutzer" value="blablabla" /></td>
<td bgcolor="#000000" colspan="2" rowspan="5"><select name="group" size="6" multiple="multiple" onclick="javascript:removeGroup()"></select></td>
</tr>
<tr>
<td class="subhead" bgcolor="#000000>Passwort</td><td><input size="32" type="password" autocomplete="off" name="passwort" value="xxxxxxxx" /></td>
</tr>
<tr>
<tr>
<td class="subhead" bgcolor="#000000">Mail</td><td><input size="32" type="text" autocomplete="off" name="mail" value="test@test.com" /></td>
</tr>
Bitte warten ..
Mitglied: rubberman
20.02.2012 um 01:15 Uhr
Hallo n0000b.

Genau hier ist auch schon Schluss mit lustig, was Batch angeht.
Da du versäumt hast den Quelltext in Code-Tags einzufassen, sieht man nicht einmal wo die Zeilen anfangen bzw. enden (was aber auch an meinem Miniatur-Screen liegen mag).
Auch mit Scriptsprachen die Reguläre Ausdrücke unterstützen, lässt sich HTML Quelltext nicht sicher parsen. Man müsste deine Dateien schon genauer unter die Lupe nehmen, um
- die Regeln zu definieren, wie die Daten zu extrahieren sind
- eine geeignete Sprache dafür auszuwählen

Grüße
rubberman
Bitte warten ..
Mitglied: n0000b
20.02.2012 um 09:52 Uhr
Hallo,

kann man in dem Batch-Code nicht auf Zeilen eingrenzen, d.h. man gibt irgendwo mit "schaue dir in der html Datei ab Zeile 340 bis 360 an".
Der o.g. Text kommt immer zwischen Zeile 340 und Zeile 360 vor.
Gibt es ansonsten Alternativen zu Batchdateien?
Bitte warten ..
Mitglied: pieh-ejdsch
20.02.2012 um 13:47 Uhr
moin,

findstr sucht Dir doch die passenden Zeilen heraus. sonst gibt es wohl Zeilen in denen der Suchstring auch noch enthalten ist.

Ich habs nochmal hier Oben leicht verändert.

Gruß Phil
Bitte warten ..
Mitglied: n0000b
20.02.2012 um 20:09 Uhr
Vielen Dank für die Mühe, aber es geht immer noch nicht

die Texte kommen öfter vor, daher wäre eine Eingrenzung auf den Abschnitt schon sinnvoll. Wie ginge die?

Ich bekomme lediglich

"Fertig!
Drücken Sie...."
zum Lesen. Das habe ich mir natürlich nicht in eine Textdatei ausgeben lassen.
Bitte warten ..
Mitglied: 60730
20.02.2012 um 20:36 Uhr
moin mädelzz,

ich schau mir das jetzt ein paar minuten an, aber vieleicht muß der Gummiman deutlicher schreiben...

Zitat von n0000b:
Vielen Dank für die Mühe, aber es geht immer noch nicht
Zitat von rubberman:
Hallo n0000b.

Genau hier ist auch schon Schluss mit lustig, was Batch angeht.

Da du versäumt hast den Quelltext in Code-Tags einzufassen, sieht man nicht einmal wo die Zeilen anfangen bzw. enden (was

aber auch an meinem Miniatur-Screen liegen mag).
Auch mit Scriptsprachen die Reguläre Ausdrücke unterstützen, lässt sich HTML Quelltext nicht sicher parsen.

Man müsste deine Dateien schon genauer unter die Lupe nehmen, um

- die Regeln zu definieren, wie die Daten zu extrahieren sind - eine geeignete Sprache dafür auszuwählen

Grüße


rubberman> die Texte kommen öfter vor, daher wäre eine Eingrenzung auf den Abschnitt schon sinnvoll. Wie ginge die?

Ich bekomme lediglich

"Fertig!
Drücken Sie...."
zum Lesen. Das habe ich mir natürlich nicht in eine Textdatei ausgeben lassen.

Natürlich
Bitte warten ..
Mitglied: pieh-ejdsch
20.02.2012 um 22:01 Uhr
moin Timo,

Du bist aber laut...

@TE
am 1.9.2011 ging es mal um dieses Thema:
Batch um WEBSITE als TXT Speichern (kein HTML CODE)
das wurde aber schon gelöscht, da es zu einfach ist *wink ironie*

ich hab hier nur die Leerzeilenlose Variante davon (und ausgekürzt)
das war gleichzeitung das resutat davon:
[Edit]
Dieser batch trennt Dir auch den HTML code Zeilenweise in eine TXT ab.
somit kannst Du die obere CMD dann dafür benutzen diese TXT zu durchsuchen.
Ein bissel Hilfe ist drin.
Testdatei:
Egebnis nach der Behandlung: Testdatei.Code.txt
[/Edit]


Wenn Du daraus etwas machen willst mit dem Anfansdings dann ... - ich bin raus.
wird so bestimmt was für Meister-B sein M-Behälter.

Gruß Phil
Bitte warten ..
Ähnliche Inhalte
HTML
Mit HTML Datei eine Textdatei auslesen
gelöst Frage von MaffiHTML7 Kommentare

hallo, ein Kunde möchte einen Lauftext auf einer Anzeigetafel, welche eine HTML Datei anzeigt regelmäßig und einfach verändern. Ich ...

Batch & Shell
String in Datei umbennen
gelöst Frage von DarkatohmBatch & Shell3 Kommentare

Hallo zusammen, ich versuche ein Batch-Skript zu schreiben, bei dem ich einen String in einer Datei umbenennen kann. Hierzu ...

Batch & Shell

Batch datei eine bestimmt Datei mit einer bestimmten software öffnen

gelöst Frage von Daoudi1973Batch & Shell3 Kommentare

Hallo zusammen, wir haben in der Arbeit Acrbat Reader als Standard Software um PDF-Dateien zu öffnen. meine Frage: wie ...

Batch & Shell

Bachtdatei: Textdatei nach String durchsuchen und Zeile unter String in Variable speichern

gelöst Frage von ichcodegerneBatch & Shell6 Kommentare

Hallo zusammen, habe vermutlich folgendes (vermutlich zimlich simpel aber ich komme nicht drauf) Problem: ich habe eine Textdatei die ...

Neue Wissensbeiträge
iOS

iOS-Bug unterbindet vollständiges VPN-Tunneling

Information von transocean vor 1 TagiOS

Moin, seit dem letzten Update hat iOS für iPhone und iPad ein Problem mit der Verschlüsselung. Lest selbst. Grüße ...

Sicherheit
Corona Malware über manipulierte Router
Information von sabines vor 1 TagSicherheit

Heise berichtet über Malware, die in Zusammenhang zum Suchethema Corona steht und über DNS Einstellungen bei D-Link und Linksys ...

Windows 10
Windows 10 Update KB4535996 fehlerhaft
Information von Frank vor 1 TagWindows 101 Kommentar

Laut Microsoft ist das Update KB4535996 die Ursache für aktuelle Verbindungsprobleme bei Virtual Private Networks (VPNs). Microsoft arbeitet bereits ...

Administrator.de Feedback
Entwicklertagebuch: Der neue Ticker ist da
Information von admtech vor 1 TagAdministrator.de Feedback3 Kommentare

Hallo User, mit dem aktuellen Release haben wir den neuen "Ticker" zur Seite hinzugefügt. Oben im Hauptmenü findet ihr ...

Heiß diskutierte Inhalte
SAN, NAS, DAS
Hilfe bei der Einrichtung vom QNAP Nas Server
gelöst Frage von Chris.21SAN, NAS, DAS18 Kommentare

Hallo, ich benötige Hilfe bei der Einrichtung meines neuen NAS Servers von QNAP. ich möchte eine Verbindung vom Internet ...

Drucker und Scanner
OCR Erkennung auf Server
Frage von KodaCHDrucker und Scanner14 Kommentare

Guten Morgen Bisher habe ich einen HP LaserJet Pro MFP M426fdw. Da es nicht viele Dokumente zum Scannen gibt ...

Router & Routing
Vigor 165 vs. Fritzbox 7590
Frage von servilianusRouter & Routing13 Kommentare

Liebe Fachleute, bisher betreibe ich folgende Konstellation Büro: 50.000er-Leitung VDSL Telekom -> Fritzbox 7590 Exposed Host -> Vigor Draytek ...

Windows Server
MS Server 2019 Berechnung Lizenzen Check
gelöst Frage von anteNopeWindows Server10 Kommentare

Hallo zusammen, ich bräuchte nur kurz eine Bestätigung meiner Berechnung und mache es deshalb kurz: 1x Server, 1 Sockel, ...