Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Saubere HTML aus Word-Dokument

Mitglied: peterpa

peterpa (Level 1) - Jetzt verbinden

28.04.2017 um 10:38 Uhr, 1418 Aufrufe, 19 Kommentare, 2 Danke

Hallo,

kennt jemand eine Möglichkeit ein Word-Dokument in eine "saubere" HTML-Seite zu wandeln? Ja es gibt die Möglichkeit diese direkt in Word als .html zu speichern ... Aber Word haut alles mit "style" Attributen voll. Das sollte aber optimaler Weise alles in einer .css stehen.

Ich habe jetzt den Ansatz es zu parsen (style-Werte in die .css und Klassen erstellen), aber sobald Word etwas an ihrer Speichervariante ändert ist ja alles wieder hin ... und besonders sauber ist das auch nicht wenn da Bsp. class="klasse001", class="klasse002", ... steht.
Mitglied: 132895
28.04.2017, aktualisiert um 10:46 Uhr
Auf Ideen kommen die Leute , nee nee nee
https://www.google.de/search?q=Word+html+cleaner
Vernünftige HTML-Editoren gibt es wie Sand am Meer.
Bitte warten ..
Mitglied: Lochkartenstanzer
28.04.2017, aktualisiert um 11:18 Uhr
Miin,

Warum nimmst Du nicht gleich einen ordentlichen HTML-Editor statt dem unpassenden Word?

Da sind ja sogar Notepad oder vi besser dafür geeignet.

lks

PS: Nur weil man ein Hammer hat muß nicht jedes Problem ein Nagel sein. Es gibt auch Schrauben

PPS: Sag jetzt nicht, die User wollen es nicht anders. Man muß ihnen nur das richtige Werkzeug zeigen.

Edit: Typos
Bitte warten ..
Mitglied: sabines
28.04.2017 um 10:46 Uhr
Zitat von Lochkartenstanzer:
PS: Nu weil man ein Hammer hat muß nicht jedes Problem rin Nagel sein. Es gibt auch Schrauben


Wenn Du als Werkzeug nur einen Hammer hast, dann sieht jedes Problem wie ein Nagel aus!
Bitte warten ..
Mitglied: peterpa
28.04.2017 um 10:53 Uhr
Ne leider nicht.
Übernimmt nicht jedes Bild, links werden auch raus gehauen, Tabellen nicht richtig dargestellt. Das Programm sollte nichts an der Darstellung ändern nur klar trennen zwischen HTML und CSS.
Bitte warten ..
Mitglied: 132895
28.04.2017, aktualisiert um 11:11 Uhr
Aus Spaghetti machst du keinen Spargel.
Nimm einen vernünftigen Wysiwyg Editor und gut is, irgendeine krumme Umwandlung führt früher oder später doch wieder zu Problemen.

Hoffe der Freitag zieht sich nicht so lang heute
Bitte warten ..
Mitglied: peterpa
28.04.2017 um 11:32 Uhr
Nimm einen vernünftigen Wysiwyg Editor und gut is, irgendeine krumme Umwandlung führt früher oder später doch wieder zu Problemen.
Leider bin ich es nicht der das entscheidet, nur der der es Umsetzen soll...
Hoffe der Freitag zieht sich nicht so lang heute
Ach was gibt es schöneres als parsen xD
Bitte warten ..
Mitglied: eisbein
28.04.2017, aktualisiert um 11:44 Uhr
Hallo!

Windows und Standards ist wie Äpfel und Birnen!

Die Ursache warum der HTML-Code nach dem Speichern aus Windows Word so aussieht liegt im internen Seitenaufbau und wie Word speichert, da kannst du nicht viel ändern - nur damit leben.

Nimm einen vernünftigen Editor und gut ist.

Es soll auch Leute geben, die Word zu PDF umwandeln, PDF zu IMG umwandeln und dann einfach das Bild ins Netz stellen dann ändert sich auch (fast) nichts an der Darstellung und es steht ganz sicher nichts mehr von irgendwelchen Klassen drin....

Schönen Freitag
Bitte warten ..
Mitglied: 132895
28.04.2017, aktualisiert um 11:48 Uhr
Leider bin ich es nicht der das entscheidet, nur der der es Umsetzen soll...
Ein guter Mitarbeiter zeichnet sich aber auch dadurch aus das er seinem Auftraggeber aufzeigt was zuverlässig und zukunftsträchtig ist und was nicht! Deine Arbeitszeit kostet ihn auch Geld und ob das mit dieser Aufgabe gut investiert ist, wage ich sehr zu bezweifeln.
Wenn du so gut im Parsen bist, dann schreib dir halt deine eigene Routine wenn du mit Regular Expressions per Du bist.
Für mich wär das kein Problem so was zu schreiben, aber den Aufwand für so einen Müll wäre es mir nicht Wert auch nur eine Finger zu krümmen.
Bitte warten ..
Mitglied: killtec
28.04.2017 um 11:46 Uhr
Hi,
du kannst doch kostenlos das Expression Web von MS laden....

Gruß
Bitte warten ..
Mitglied: BassFishFox
28.04.2017 um 12:12 Uhr
Hallo,

Windows und Standards ist wie Äpfel und Birnen!

Appel und Birne sind mittlerweile gleich.

https://www.heise.de/newsticker/meldung/Markenrechtsstreit-Apple-gewinnt ...


Schoenes WE
BFF
Bitte warten ..
Mitglied: Apophis
28.04.2017 um 13:01 Uhr
Ein HTML-Editor, der noch dazu frei ist, wäre z.B. Webocton Sciptly.

Word jedenfalls würde ich nicht nehmen. Dem würde ich noch nicht mal eine normale Textdatei anvertrauen wenn ich es nicht müsste.

Merke: Word heißt "Word", weil es nur für einzelne Worte geeignet ist. Sonst hieße es "Satz" oder gar "Absatz".

Gruß
Apophis
Bitte warten ..
Mitglied: Lochkartenstanzer
28.04.2017, aktualisiert um 13:43 Uhr
Zitat von Apophis:

Merke: Word heißt "Word", weil es nur für einzelne Worte geeignet ist. Sonst hieße es "Satz" oder gar "Absatz".


Falsch! Sentence oder Paragraph!

lks
Bitte warten ..
Mitglied: Herbrich19
29.04.2017 um 02:22 Uhr
Hallo,

Das Probelm an Word ist dass wen man die Text für seine sauber kodierte Homepage schreibnt landet html mit in der paste und nun ja. Word HTML Cleaner sind durchaus von vorteil. Der HTML dient eig auch nur dazu aus HTML wieder Word zu machen.

Gruß an die IT-Welt,
J Herbrich
Bitte warten ..
Mitglied: Pedant
29.04.2017 um 12:39 Uhr
Hallo peterpa,

Zitat von peterpa
Aber Word haut alles mit "style" Attributen voll. Das sollte aber optimaler Weise alles in einer .css stehen.

Ist es wirklich wichtig ob die "styles" im Html oder in der css stehen?
Wenn das das einzige ist, was Dich am monströsen html-Output von MS-Office stört, würde ich Dir raten das zu ignorieren, statt es mit viel Aufwand zu ändern.
Im Browser siehst Du den Unterschied nicht und "styles" im Html sind nicht unzulässig.

Mein Html-Editor heißt Notepad, nicht weil ich so cool bin und es voll drauf habe, sondern weil ich gerne nachvollziehen können möchte was ich "programmiere" und von daher generiertes Html für mich ablehne.

Wenn es Dir darum geht irgendwelche Inhalte, die mit Word erstellt werden, ins Web zu bringen, dann lass doch Word machen was es will und stell das Zeug online.
Vor wem möchtest Du denn sauber dastehen und wozu?
Auch die Google-Startseite https://www.google.de kommt nicht ohne Fehler durch den Validator.

Ich würde es auch gegrüßen, wenn alle Autoren sich an die empfohlenen Vorgaben halten würden, aber dann wäre es auch schön, die Browser täten das auch.
In Deinem Fall denke ich einfach an Aufwand und Nutzen, Kirche und Dorf,...

Ich habe gerade mal testweise Hallo Welt! ins Word 2007 getippt und als html gespeichert.
Ergebnis:
Hallo Welt.htm (444 Zeile)
Hallo Welt-Dateien\colorschememapping.xml (2 Zeilen)
Hallo Welt-Dateien\filelist.xml (6 Zeilen)
Hallo Welt-Dateien\themedata.thmx (3.082 Bytes binärer Krempel)
Wenn es jetzt noch eine css-Datei gäbe würde mich das nicht glücklicher machen.

Wenn Du ein Word-Dokument unbedingt in komplett sauberes, Html wandeln möchtest, dann geht das eigentlich nur so:
<a href="Datei.doc">Datei.doc</a>
Gruß Frank
Bitte warten ..
Mitglied: Herbrich19
29.04.2017 um 18:30 Uhr
Hallo,

Styles im HTML sind schlecht für's SEO

Gruß an die IT-Welt,
J Herbrich
Bitte warten ..
Mitglied: peterpa
01.05.2017 um 09:59 Uhr
Danke soweit.

Das mit der doc einbinden klingt interessant

Naja eine saubere css hat eben den Vorteil eventuelle spätere Änderungen am Design leichter einzupflegen...
Bitte warten ..
Mitglied: Lochkartenstanzer
01.05.2017, aktualisiert um 10:15 Uhr
Zitat von peterpa:

Naja eine saubere css hat eben den Vorteil eventuelle spätere Änderungen am Design leichter einzupflegen...

Naja, wenn man zum Designen Word nimmt, macht man Designänderungen natürlich auch in Word. Man sollte nur darauf achten, mit Formatvorlagen zu arbeiten udn nciht mit dedizierten textauszeichnungen.

lks

PS. Sag deg Leuten, die sollen in word nur reinem unformattierten Text schreiben. Dann kannst Du das genz leicht in Dein Design einbinden.
Bitte warten ..
Mitglied: Herbrich19
02.05.2017 um 09:38 Uhr
Hallo,

Nicht zwingtend. Ich schreibe die Texte für meine Homepage lieber in Word und mach Copy & Paste in Visual Studio 2010 wen ich vor habe diese zu Publizieren.

Ich bin dabei ein eigenes Plugin zu schreiben was sich direkt mit der API meiner Homepage verbindet um zu publizieren aber dass ist alles noch in Arbeit. Fakt ist dass Word auch für Homepages zum erstellen von Texten verwendet werden kann und auch wird.

Also das Design in Word zu machen ist Schwachsinn (finde ich als meine persönliche Meinung) und naja da braucht man auch nicht wirklich das CSS von Word mit drinnen nur um später aus der HTML wieder eine Oreginale Word Datei zu erstellen. Weil ja genau dafür diese Stylesheets da sind.

Gruß an die IT-Welt,
J Herbrich
Bitte warten ..
Ähnliche Inhalte
Backup
Backup von WORD dokument
gelöst Frage von justdanBackup9 Kommentare

Hallo, Ein WORD Dokument wurde überschrieben! Kann ich irgendwie dieses DOC Backupen von gestern oder vorgestern machen? Also Veritas ...

Microsoft Office

Word-Dokument ändert automatisch Formatierung

gelöst Frage von HertieMicrosoft Office3 Kommentare

Guten Morgen Gemeinde, ich stehe gerade vor einem Problem, das ich nicht verstehe und wende mich daher an euch! ...

Windows Server

Word-Dokument mit Powershell bearbeiten

gelöst Frage von Peter0816Windows Server5 Kommentare

Hallo, ich würde gerne ein Worddokument, welches ich mit Variablen versehen habe, durch Werte mit Powershell ersetzten. Hatte mir ...

Microsoft Office

Word 2016 skaliert Grafik im Dokument - Word zoomt

Frage von EdaseinsMicrosoft Office5 Kommentare

Hallo Liebe Community, Habe hier einen Kopfschmerzfall Auf einem "TSplus" PC arbeiten 5 Leute, alle nutzen die selben Dokumente, ...

Neue Wissensbeiträge
Erkennung und -Abwehr
Emotet mit Rspamd und Oletools bekämpfen
Tipp von Dani vor 11 StundenErkennung und -Abwehr1 Kommentar

Moin, Um oletools während der Annahme einer E-Mail die bereits angehängten Office-Dateien analysieren lassen zu können, haben wir für ...

Viren und Trojaner

Gratis-Entschlüsselungstool für STOP-Ransomware verfügbar

Information von AnkhMorpork vor 18 StundenViren und Trojaner

Der Sicherheitsanbieter Emisoft hat ein kostenloses Tool veröffentlicht, mit dem sich Dateien entschlüsseln lassen, die die Ransomware STOP unbrauchbar ...

Off Topic
8 zoll disketten
Information von brammer vor 1 TagOff Topic5 Kommentare

Hallo, ob das so gut ist brammer

Off Topic
Noch mehr was ich nicht brauche
Information von brammer vor 4 TagenOff Topic6 Kommentare

Hallo, WOFÜR? WARUM? brammer

Heiß diskutierte Inhalte
Windows 7
Alter PC abgebrannt - Festplatte im neuen PC führt zum Bluescreen
gelöst Frage von CAT404Windows 725 Kommentare

Moin ich habe seit heute mittag einen PC aufm Tisch stehen, total verzweifelter Eigentümer. Der Rechner ist so ein ...

Server-Hardware
Welches Betriebssystem für DL380p Gen8 für den Heimgebrauch
Frage von peter91gServer-Hardware17 Kommentare

Hallo zusammen, betreibe Zuhause einen Dl380p G8 derzeit mit ESXI in der Testversion. Es läuft je nach Bedarf Ubuntu ...

Windows Server
Powershell Skript kann nicht geladen werden
Frage von renatus85Windows Server14 Kommentare

Hallo, ich habe folgendes Anliegen: In unserer Organisation setzen wir AlwaysOn VPN ein. Das funktioniert soweit auch ohne Probleme. ...

Router & Routing
ARCHER C7 als Open VPN-Server im Netwerk einer Fritzbox 6490
Frage von thburkhartRouter & Routing14 Kommentare

Guten Tag, ich habe bei UnityMedia eine Fritzbox 6490, die die Verbindung zur WAN-Seite herstellt. Einen VPN-Zugriff realisiere über ...