nordicmike
Goto Top

Windows Explorer Zeichensatzkodierung

Moin zusammen,

mit welcher Zeichensatz Kodierung legt der Windows Explorer (oder z.B. Outlook, wenn ein Anhang gespeichert werden soll) im Netzwerk ab? UFT-8?

Es geht um ein Linux Share, das von einem Windows 10 Rechner Dateien abgelegt bekommt.
1) Der Windows Rechner kann diese dort auch richtig mit Umlauten sehen
2) Die Shell auf dem Linux Server, auf dem der Samba Share läuft, sieht diese auch noch richtig.
3) Der Owncloud Sync Dienst, der diese Dateien zu sich auf den OwnCloud Server synchronisieren soll, legt sie mit Hieroglyphen ab.

Der Effekt ist dann, dass der nächste Durchgang vom Owncloud Sync neue Ordner findet (mit Hieroglyphen) und sich dann sagt: Schön, dann synchronisieren wir die gleich mal auf den Share rüber, und schon sind alle Ordner auf dem Share doppelt vorhanden, die Umlaute oder Chinesische Zeichen besitzen.

Der Linux Admin fragt mich nun mit welchem Zeichensatzformat diese Dateinamen von Windows abgelegt werden?!? Kann ich das irgendwie Ermitteln?
Der Samba Share hat in seiner smb4.conf:
unix charset = UTF-8

Danke euch and keep rockin'

Der Mike

Content-ID: 3616966691

Url: https://administrator.de/contentid/3616966691

Printed on: October 15, 2024 at 02:10 o'clock

MirkoKR
MirkoKR Aug 11, 2022 at 08:57:12 (UTC)
Goto Top
Hi.

Zitat von @NordicMike:

mit welcher Zeichensatz Kodierung legt der Windows Explorer (oder z.B. Outlook, wenn ein Anhang gespeichert werden soll) im Netzwerk ab? UFT-8?

Warum sollte Windows/Outlook IN EINEM ANHANG etwas an der Codierung ändern?

Sollte dein Wunsch sein, die Codierung IN einem Anhang - also einer Datei - ändern wollen, brauchst du extra Schritte nach dem Speichern!

z.B. mit Powershell??
SlainteMhath
SlainteMhath Aug 11, 2022 at 09:20:39 (UTC)
Goto Top
@MirkoKR
Aus dem Text ergibt sich, das es sich um Dateinamen/-Pfad handelt, nicht um den Inhalt.
3479126418
3479126418 Aug 11, 2022 updated at 09:49:40 (UTC)
Goto Top
NordicMike
NordicMike Aug 11, 2022 at 10:05:34 (UTC)
Goto Top
Genau, es geht nur um die Dateinamen, die Hieroglyphen zeigen.

Aus dem Link mit der Character Sequence werde ich nicht schlau:

All Unicode characters MUST be in UTF-16LE encoding.
Was bedeutet "must be"? Das scheint nicht die Art zu sein, wie der LANman auf dem Share ablegt, sondern "must be" klingt nach "er erwartet" irgendwo diesen Zeichensatz. Heisst das im Umkehrschluss, dass er selbst auch so ablegt?

Muss der Linux Admin auf einem SMB Server das UTF-16LE statt UTF-8 in der smb4.conf eintragen?
3479126418
3479126418 Aug 11, 2022 updated at 10:13:17 (UTC)
Goto Top
Ob Unicode über SMB verwendet wird, wird bei der SMB Session Aushandlung festgelegt.
Schau also mal in deinen Verbindungsaufbau mit dem Server.
Windows selbst und auch der Explorer verwendet für die Ablage seiner Dateinamen intern UTF-16 auf NTFS.
Ich tippe hier eher darauf das der Owncloud-Sync Mist baut.