Wie entferne ich HTML Tags aus Excel Dateien?
Hallo,
ich habe eine Excel Datei (Excel 2010), welche ein Download einer HTML Seite ist. Daher beinhaltet sie viele HTML Tags, wie Sonderzeichen, etc. Nun habe ich gestern das Macro erstellt welches hier Sonderzeichen in Excel per Makro entfernen gepostet wurde.. Alles schön und gut, ABER da fallen z. B. bei <tag> die Sonerzeichen < > weg, aber 'tag' bleibt stehen.. Wie kann ich das am Besten lösen?
Vielen lieben Dank für eure Hilfe!!!
Liebe Grüße
Hülya
ich habe eine Excel Datei (Excel 2010), welche ein Download einer HTML Seite ist. Daher beinhaltet sie viele HTML Tags, wie Sonderzeichen, etc. Nun habe ich gestern das Macro erstellt welches hier Sonderzeichen in Excel per Makro entfernen gepostet wurde.. Alles schön und gut, ABER da fallen z. B. bei <tag> die Sonerzeichen < > weg, aber 'tag' bleibt stehen.. Wie kann ich das am Besten lösen?
Vielen lieben Dank für eure Hilfe!!!
Liebe Grüße
Hülya
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 211819
Url: https://administrator.de/contentid/211819
Ausgedruckt am: 22.11.2024 um 04:11 Uhr
12 Kommentare
Neuester Kommentar
Hallo hlynlc!
Wie importierst Du die Html-Datei und ist das eine öffentliche Website?
Gruß Dieter
Wie importierst Du die Html-Datei und ist das eine öffentliche Website?
Gruß Dieter
Hallo hlynlc!
Und was hälst Du von der Möglichkeit, die Html-Datei temporär zu speichern und per Excel-QueryTable-Funktion als Tabelle zu importieren und gegebenenfalls wieder als Csv-Datei zu exportieren?
Gruß Dieter
Und was hälst Du von der Möglichkeit, die Html-Datei temporär zu speichern und per Excel-QueryTable-Funktion als Tabelle zu importieren und gegebenenfalls wieder als Csv-Datei zu exportieren?
Gruß Dieter
Hallo Hülya!
Ups, da habe ich wohl nicht richtig gelesen
Bin davon ausgegangen, dass die Html-Tags entfern werden sollen, aber sollen sie ja garnicht, insofern vergiss meine bisherigen Kommentare
Den Makro-Code schaue ich mir noch an und berichte, wenn mir was dazu einfällt...
Gruß Dieter
ich habe gerade nicht viel Ahnung , wovon du sprichst.. Aber das Prozedere des Uploads zu ändern, wäre in meinem Fall zu aufwändig.. Meine Frage deutet eher mehr auf das wie oben im ersten Post geschildert, die Idee mit dem Makro. Gibt es hierzu keinen ähnlichen Ausweg?
Ups, da habe ich wohl nicht richtig gelesen
Bin davon ausgegangen, dass die Html-Tags entfern werden sollen, aber sollen sie ja garnicht, insofern vergiss meine bisherigen Kommentare
Den Makro-Code schaue ich mir noch an und berichte, wenn mir was dazu einfällt...
Gruß Dieter
Hallo Hülya!
Wie groß wird den die Löschliste und gibt es dazu noch eine erlaubt/nichterlaubt-Liste für Sonderzeichen?
Gruß Dieter
Wie groß wird den die Löschliste und gibt es dazu noch eine erlaubt/nichterlaubt-Liste für Sonderzeichen?
Gruß Dieter
Hallo
Zunächst mal ein Beispiel zum entfernen der Tags '<div>' und '<strong>'
Mache eine Liste mit unerlaubten Sonderzeichen die gelöscht werden sollen, also genauso wie bei den Tags oder eine Liste mit Sonderzeichen, die durch andere ersetzt werden sollen z.B.:
"ä,ae,ü,ue"
wobei Du zum Löschen, das zweite Zeichen mit 0 angibst...
Gruß Dieter
[edit] Codezeile 9 geändert [/edit]
Zunächst mal ein Beispiel zum entfernen der Tags '<div>' und '<strong>'
Private Const sDelTags = "div,strong" 'Tag-Liste Kommagetrennt erweitern
Public Sub DeleteTags()
Dim aDelTags As Variant, vTag As Variant
aDelTags = Split(sDelTags, ",")
For Each vTag In aDelTags
Cells.Replace "<" & Trim(vTag) & ">", "", LookAt:=xlPart, MatchCase:=False
Next
End Sub
Mache eine Liste mit unerlaubten Sonderzeichen die gelöscht werden sollen, also genauso wie bei den Tags oder eine Liste mit Sonderzeichen, die durch andere ersetzt werden sollen z.B.:
"ä,ae,ü,ue"
wobei Du zum Löschen, das zweite Zeichen mit 0 angibst...
Gruß Dieter
[edit] Codezeile 9 geändert [/edit]
Hallo hlynlc!
Aber, die braucht man nicht in die Liste aufnehmen. Stattdessen einfach die Replace-Zeile kopieren und eine Zeile darunter einfügen und dann noch "<" durch "</" ersetzen...
Mit der Liste in Form "ü,ue", dann in etwa so:
Wobei das Trim Leerzeichen entfernt, falls vorhanden
Gruß Dieter
[edit] Codezeile 8 (MatchCase:=False) geändert [/edit]
Da HTML Tags auch ein Ende haben face-smile enthält die Datei natürlich auch solche wie </div>
Das war mir schon klarAber, die braucht man nicht in die Liste aufnehmen. Stattdessen einfach die Replace-Zeile kopieren und eine Zeile darunter einfügen und dann noch "<" durch "</" ersetzen...
Mit der Liste in Form "ü,ue", dann in etwa so:
Private Const sReplaceChar = "ä,ae,Ä,Ae,ö,oe,Ö,Oe,ü,ue,Ü,Ue"
'.....
aReplaceChar = Split(sReplaceChar, ",") 'String in Array splitten
For i = 0 To UBound(aReplaceChar) Step 2 'Array in Zweierschritten auslesen
Cells.Replace Trim(aReplaceChar(i)), Trim(aReplaceChar(i + 1)), LookAt:=xlPart, MatchCase:=True
Next
'.....
Gruß Dieter
[edit] Codezeile 8 (MatchCase:=False) geändert [/edit]
Hallo Hülya!
Und kennzeichne den Thread bitte noch als gelöst. Danke
Gruß Dieter
Die Frage wurde somit gelöst. Vielen lieben Dank für die Unterstützung!!
Gerne dochUnd kennzeichne den Thread bitte noch als gelöst. Danke
Gruß Dieter