Saubere HTML aus Word-Dokument

Mitglied: peterpa

peterpa (Level 1) - Jetzt verbinden

28.04.2017 um 10:38 Uhr, 2285 Aufrufe, 19 Kommentare, 2 Danke

Hallo,

kennt jemand eine Möglichkeit ein Word-Dokument in eine "saubere" HTML-Seite zu wandeln? Ja es gibt die Möglichkeit diese direkt in Word als .html zu speichern ... Aber Word haut alles mit "style" Attributen voll. Das sollte aber optimaler Weise alles in einer .css stehen.

Ich habe jetzt den Ansatz es zu parsen (style-Werte in die .css und Klassen erstellen), aber sobald Word etwas an ihrer Speichervariante ändert ist ja alles wieder hin ... und besonders sauber ist das auch nicht wenn da Bsp. class="klasse001", class="klasse002", ... steht.
Mitglied: 132895
28.04.2017, aktualisiert um 10:46 Uhr
Auf Ideen kommen die Leute , nee nee nee
https://www.google.de/search?q=Word+html+cleaner
Vernünftige HTML-Editoren gibt es wie Sand am Meer.
Bitte warten ..
Mitglied: Lochkartenstanzer
28.04.2017, aktualisiert um 11:18 Uhr
Miin,

Warum nimmst Du nicht gleich einen ordentlichen HTML-Editor statt dem unpassenden Word?

Da sind ja sogar Notepad oder vi besser dafür geeignet.

lks

PS: Nur weil man ein Hammer hat muß nicht jedes Problem ein Nagel sein. Es gibt auch Schrauben

PPS: Sag jetzt nicht, die User wollen es nicht anders. Man muß ihnen nur das richtige Werkzeug zeigen.

Edit: Typos
Bitte warten ..
Mitglied: sabines
28.04.2017 um 10:46 Uhr
Zitat von Lochkartenstanzer:
PS: Nu weil man ein Hammer hat muß nicht jedes Problem rin Nagel sein. Es gibt auch Schrauben


Wenn Du als Werkzeug nur einen Hammer hast, dann sieht jedes Problem wie ein Nagel aus!
Bitte warten ..
Mitglied: peterpa
28.04.2017 um 10:53 Uhr
Ne leider nicht.
Übernimmt nicht jedes Bild, links werden auch raus gehauen, Tabellen nicht richtig dargestellt. Das Programm sollte nichts an der Darstellung ändern nur klar trennen zwischen HTML und CSS.
Bitte warten ..
Mitglied: 132895
28.04.2017, aktualisiert um 11:11 Uhr
Aus Spaghetti machst du keinen Spargel.
Nimm einen vernünftigen Wysiwyg Editor und gut is, irgendeine krumme Umwandlung führt früher oder später doch wieder zu Problemen.

Hoffe der Freitag zieht sich nicht so lang heute
Bitte warten ..
Mitglied: peterpa
28.04.2017 um 11:32 Uhr
Nimm einen vernünftigen Wysiwyg Editor und gut is, irgendeine krumme Umwandlung führt früher oder später doch wieder zu Problemen.
Leider bin ich es nicht der das entscheidet, nur der der es Umsetzen soll...
Hoffe der Freitag zieht sich nicht so lang heute
Ach was gibt es schöneres als parsen xD
Bitte warten ..
Mitglied: eisbein
28.04.2017, aktualisiert um 11:44 Uhr
Hallo!

Windows und Standards ist wie Äpfel und Birnen!

Die Ursache warum der HTML-Code nach dem Speichern aus Windows Word so aussieht liegt im internen Seitenaufbau und wie Word speichert, da kannst du nicht viel ändern - nur damit leben.

Nimm einen vernünftigen Editor und gut ist.

Es soll auch Leute geben, die Word zu PDF umwandeln, PDF zu IMG umwandeln und dann einfach das Bild ins Netz stellen dann ändert sich auch (fast) nichts an der Darstellung und es steht ganz sicher nichts mehr von irgendwelchen Klassen drin....

Schönen Freitag
Bitte warten ..
Mitglied: 132895
28.04.2017, aktualisiert um 11:48 Uhr
Leider bin ich es nicht der das entscheidet, nur der der es Umsetzen soll...
Ein guter Mitarbeiter zeichnet sich aber auch dadurch aus das er seinem Auftraggeber aufzeigt was zuverlässig und zukunftsträchtig ist und was nicht! Deine Arbeitszeit kostet ihn auch Geld und ob das mit dieser Aufgabe gut investiert ist, wage ich sehr zu bezweifeln.
Wenn du so gut im Parsen bist, dann schreib dir halt deine eigene Routine wenn du mit Regular Expressions per Du bist.
Für mich wär das kein Problem so was zu schreiben, aber den Aufwand für so einen Müll wäre es mir nicht Wert auch nur eine Finger zu krümmen.
Bitte warten ..
Mitglied: killtec
28.04.2017 um 11:46 Uhr
Hi,
du kannst doch kostenlos das Expression Web von MS laden....

Gruß
Bitte warten ..
Mitglied: BassFishFox
28.04.2017 um 12:12 Uhr
Hallo,

Windows und Standards ist wie Äpfel und Birnen!

Appel und Birne sind mittlerweile gleich.

https://www.heise.de/newsticker/meldung/Markenrechtsstreit-Apple-gewinnt ...


Schoenes WE
BFF
Bitte warten ..
Mitglied: Apophis
28.04.2017 um 13:01 Uhr
Ein HTML-Editor, der noch dazu frei ist, wäre z.B. Webocton Sciptly.

Word jedenfalls würde ich nicht nehmen. Dem würde ich noch nicht mal eine normale Textdatei anvertrauen wenn ich es nicht müsste.

Merke: Word heißt "Word", weil es nur für einzelne Worte geeignet ist. Sonst hieße es "Satz" oder gar "Absatz".

Gruß
Apophis
Bitte warten ..
Mitglied: Lochkartenstanzer
28.04.2017, aktualisiert um 13:43 Uhr
Zitat von Apophis:

Merke: Word heißt "Word", weil es nur für einzelne Worte geeignet ist. Sonst hieße es "Satz" oder gar "Absatz".


Falsch! Sentence oder Paragraph!

lks
Bitte warten ..
Mitglied: Herbrich19
29.04.2017 um 02:22 Uhr
Hallo,

Das Probelm an Word ist dass wen man die Text für seine sauber kodierte Homepage schreibnt landet html mit in der paste und nun ja. Word HTML Cleaner sind durchaus von vorteil. Der HTML dient eig auch nur dazu aus HTML wieder Word zu machen.

Gruß an die IT-Welt,
J Herbrich
Bitte warten ..
Mitglied: Pedant
29.04.2017 um 12:39 Uhr
Hallo peterpa,

Zitat von peterpa
Aber Word haut alles mit "style" Attributen voll. Das sollte aber optimaler Weise alles in einer .css stehen.

Ist es wirklich wichtig ob die "styles" im Html oder in der css stehen?
Wenn das das einzige ist, was Dich am monströsen html-Output von MS-Office stört, würde ich Dir raten das zu ignorieren, statt es mit viel Aufwand zu ändern.
Im Browser siehst Du den Unterschied nicht und "styles" im Html sind nicht unzulässig.

Mein Html-Editor heißt Notepad, nicht weil ich so cool bin und es voll drauf habe, sondern weil ich gerne nachvollziehen können möchte was ich "programmiere" und von daher generiertes Html für mich ablehne.

Wenn es Dir darum geht irgendwelche Inhalte, die mit Word erstellt werden, ins Web zu bringen, dann lass doch Word machen was es will und stell das Zeug online.
Vor wem möchtest Du denn sauber dastehen und wozu?
Auch die Google-Startseite https://www.google.de kommt nicht ohne Fehler durch den Validator.

Ich würde es auch gegrüßen, wenn alle Autoren sich an die empfohlenen Vorgaben halten würden, aber dann wäre es auch schön, die Browser täten das auch.
In Deinem Fall denke ich einfach an Aufwand und Nutzen, Kirche und Dorf,...

Ich habe gerade mal testweise Hallo Welt! ins Word 2007 getippt und als html gespeichert.
Ergebnis:
Hallo Welt.htm (444 Zeile)
Hallo Welt-Dateien\colorschememapping.xml (2 Zeilen)
Hallo Welt-Dateien\filelist.xml (6 Zeilen)
Hallo Welt-Dateien\themedata.thmx (3.082 Bytes binärer Krempel)
Wenn es jetzt noch eine css-Datei gäbe würde mich das nicht glücklicher machen.

Wenn Du ein Word-Dokument unbedingt in komplett sauberes, Html wandeln möchtest, dann geht das eigentlich nur so:
Gruß Frank
Bitte warten ..
Mitglied: Herbrich19
29.04.2017 um 18:30 Uhr
Hallo,

Styles im HTML sind schlecht für's SEO

Gruß an die IT-Welt,
J Herbrich
Bitte warten ..
Mitglied: peterpa
01.05.2017 um 09:59 Uhr
Danke soweit.

Das mit der doc einbinden klingt interessant

Naja eine saubere css hat eben den Vorteil eventuelle spätere Änderungen am Design leichter einzupflegen...
Bitte warten ..
Mitglied: Lochkartenstanzer
01.05.2017, aktualisiert um 10:15 Uhr
Zitat von peterpa:

Naja eine saubere css hat eben den Vorteil eventuelle spätere Änderungen am Design leichter einzupflegen...

Naja, wenn man zum Designen Word nimmt, macht man Designänderungen natürlich auch in Word. Man sollte nur darauf achten, mit Formatvorlagen zu arbeiten udn nciht mit dedizierten textauszeichnungen.

lks

PS. Sag deg Leuten, die sollen in word nur reinem unformattierten Text schreiben. Dann kannst Du das genz leicht in Dein Design einbinden.
Bitte warten ..
Mitglied: Herbrich19
02.05.2017 um 09:38 Uhr
Hallo,

Nicht zwingtend. Ich schreibe die Texte für meine Homepage lieber in Word und mach Copy & Paste in Visual Studio 2010 wen ich vor habe diese zu Publizieren.

Ich bin dabei ein eigenes Plugin zu schreiben was sich direkt mit der API meiner Homepage verbindet um zu publizieren aber dass ist alles noch in Arbeit. Fakt ist dass Word auch für Homepages zum erstellen von Texten verwendet werden kann und auch wird.

Also das Design in Word zu machen ist Schwachsinn (finde ich als meine persönliche Meinung) und naja da braucht man auch nicht wirklich das CSS von Word mit drinnen nur um später aus der HTML wieder eine Oreginale Word Datei zu erstellen. Weil ja genau dafür diese Stylesheets da sind.

Gruß an die IT-Welt,
J Herbrich
Bitte warten ..
Heiß diskutierte Inhalte
Windows Server
Veeam - DCs restore - 0xc00002e2
gelöst Freak-On-SiliconFrageWindows Server22 Kommentare

Servus; Ich hab hier zwei Server 2012R2 DCs auf jeweils einem Hyper-V sitzen. Gesichert wird mit Veeam B&R. JA, ...

CPU, RAM, Mainboards
Hardwareanforderung für Remote Desktop
gelöst Diddi-tbFrageCPU, RAM, Mainboards14 Kommentare

Hallo zusammen, ich brauche mal wieder einen Rat von euch. Mein Chef möchte gerne öfter von zu Hause aus ...

TK-Netze & Geräte
Störung Fax2Mail bei NFON am 24.10.20? Kein Mailversand von NFON möglich?
gelöst StefanKittelFrageTK-Netze & Geräte12 Kommentare

Hallo, scheinbar gibt es eine Störung bei NFONs Fax2Mail am heutigen Tag 24.10.20. Man kann Faxe an schicken und ...

Microsoft
Sharepoint Website für externe User
RoadmaxFrageMicrosoft8 Kommentare

Hallo Zusammen, ich möchte eine komplette Website für externe User (Gäste) freigeben, in der sie nur "lesen" können. Dabei ...

LAN, WAN, Wireless
Studentenwohnheim LAN Anschluss mit Router verbinden
SchweisserFrageLAN, WAN, Wireless8 Kommentare

Hallo Leute, ich habe zu dem Thema schon einige Beiträge gelesen, konnte aber für meinen Fall bisher keine funktionierende ...

DNS
DNS in AD und pfSense - pfBlockerNG Listen werden nicht beruecksichtigt
DerDummePeterFrageDNS7 Kommentare

Moin, ich bin der Peter und hab mich hier nun doch angemeldet. Ich habe mit IT ueberhaupt nix zu ...

Ähnliche Inhalte
Backup
Backup von WORD dokument
gelöst justdanFrageBackup9 Kommentare

Hallo, Ein WORD Dokument wurde überschrieben! Kann ich irgendwie dieses DOC Backupen von gestern oder vorgestern machen? Also Veritas ...

Microsoft Office

Word-Dokument ändert automatisch Formatierung

gelöst HertieFrageMicrosoft Office3 Kommentare

Guten Morgen Gemeinde, ich stehe gerade vor einem Problem, das ich nicht verstehe und wende mich daher an euch! ...

Windows 7

Commandbutton in Word Dokument auslösen

gelöst mark47FrageWindows 79 Kommentare

Guten Tag und einen schönen Sonntag. Sitze gerade vor einem wie ich hoffe kleinem Problem in dieser Interessenrunde. Ich ...

Microsoft Office

Word 2016 skaliert Grafik im Dokument - Word zoomt

EdaseinsFrageMicrosoft Office5 Kommentare

Hallo Liebe Community, Habe hier einen Kopfschmerzfall Auf einem "TSplus" PC arbeiten 5 Leute, alle nutzen die selben Dokumente, ...

Microsoft Office

Aktualisierung von Datum in Word Dokument

gelöst BADwolfFrageMicrosoft Office3 Kommentare

Hallo Zusammen, evtl nur ein kleiner lokaler Fehler. In einem auf einer freigabe abliegenden Word Dokument ist ein sich ...

Visual Studio

VB.Net - Word Dokument wird nicht abgespeichert

gelöst Pat.batFrageVisual Studio4 Kommentare

Hallo zusammen, folgende Methode öffnet zwar das Template und fügt den String in die Textmarke, aber das Dokument wird ...

Berechtigungs- und IdentitätsmanagementBerechtigungs- und IdentitätsmanagementWebdienste und -serverWebdienste und -serverDatenbankenDatenbankenMonitoring & SupportMonitoring & SupportHybrid CloudHybrid CloudSmall Business ITSmall Business IT