CNC Maschinen verlieren Netzwerkverbindung (kurioser Fehler)
Hallo Leidensgenossen,
auch auf die Gefahr hin dass das hier als Freitagsfrage abgestempelt wird hoffe ich auf brauchbaren Input für diesen - aus meiner bescheidenen Sicht - durchaus kuriosen Fehler.
Wir haben vor einiger Zeit die komplette Betreuung eines Kunden übernommen da der interne IT'ler das Unternehmen verlassen hat. Einige Tage danach hat dieser Fehler begonnen mich verrückt zu machen. Ich werde versuchen die Prolematik so genau wie möglich zu beschreiben, wenn euch weitere Infos interessieren, oder ich etwas vergessen haben sollte, bitte nachfragen.
Kunde setzt 2 CNC Maschinen mit sehr alten Steuerungen ein. Die Steuerung basiert auf 486'er Systemen, die Netzwerkkarten sind tatsächlich noch ISA Karten. Grundsätzlich greifen diese beiden Systeme nur auf das jeweils andere zu (Programm wird an Maschine 1 erstellt und falls notwendig auch auf Maschine 2 via Netzwerk übertragen). Ein Zugriff vom Netzwerk aus auf die beiden CNC Maschinen findet nur 1x pro Woche statt um die erstellten Programme via FTP zu sichern.
Der Aufbau sieht folgendermaßen aus:
CNC Maschine 1 -> Cat5e Kabel -> 8 Port billig Switch
CNC Maschine 2 -> Cat5e Kabel -> 8 Port billig Switch
8 Port billig Switch -> über Dose/Verlegekabel Cat7(vermutlich) -> HP 2530 Switch
Direktes Verkabeln mit dem 2530'er leider nicht möglich, dazu müssten neue Kabel gezogen werden was der Kunde ablehnt.
Der 2530'er ist ein 48 Port Gerät das fast vollständig belegt ist, an keinem der anderen Geräte die dort dran hängen treten Fehler auf.
Die Geräte befindens ich in einem relativ leeren VLAN in dem sich nur ca. 20 andere Geräte befinden, hauptsächlich Switche und andere Netzwerkgeräte.
Dieser Aufbau hat über Jahre hinweg problemlos funktioniert. Seit einiger Zeit ist es nun so dass beide CNC Maschine (erst eine, ca. eine Minute später die andere) die Netzwekverbindung verlieren.
Das äußert sich so dass zwar noch ein Link zur Maschine besteht aber keinerlei Daten mehr übertragen werden, auch ein Ping ist nicht mehr möglich. Weder zwischen den Maschinen noch vom restlichen Netzwerk aus zu den Maschinen. Werden die Maschinen neu gestartet funktioniert alles wieder für einige Minuten, danch der gleiche Fehler wieder.
Interessant daran ist dass sobald die Verbindung des billig Switches zum Netzwerk getrennt wird (also nur die beiden Maschinen alleine an diesem Switch, ohne Vebindung zum Rest der Welt) das Problem nicht auftritt. Hängt man z.B. ein Notebook mit dazu um dort die Sicherung manuell auszuführen tritt das Problem ebenfalls nicht auf. Sobald dann das Patchkabel in Richtung Firmen LAN eingesteckt wird dauert es ca. 1-3 Minuten und beide Geräte sind nicht mehr erreichbar. Auch nicht wenn man alle Kabel trennt und sich direkt mit der Maschine verbindet (Crossover, manuelle Einstellungen Link Speed getestet).
Die Maschinen haben statische IPs und laufen unter einen scheinbar stark umgebauten DOS System. Einzelheiten zum OS kann ich leider nicht wirklich nennen da sich der Hersteller hier ziemlich bedeckt hält. Interessant ist aber dass die es scheinbar hinbekommen haben sowohl ein Dual-Screen Setup als auch Touchscreen Support in das DOS System zu bekommen. Die Aussage dass es DOS (welches auch immer) ist kommt vom Hersteller, gebe das so weiter.
Was wir bisher erfoglos versucht haben:
Austausch billig Switch gegen teureren billig Switch
Austausch billig Switch gegen managebaren Switch, Ports manuell auf 10/100 Mbit/s halb/voll gestellt
Austausch der Netzwerkkarten an den Maschinen und generelle Fehlersuche durch den Support des Herstellers
Austausch aller irgendwie beteiligten Kabel
Sniffen via Wireshark während der Fehler auftritt -> es ist absolut kein einziges Paket von den Maschinen zu sehen
Ausschluss von IP Adress Konflikten
Notebook direkt mit den Maschinen verbunden nachdem der Fehler auftritt -> kein einziges Paket sichtbar
Ich bin hier mittlerweile ziemlich ratlos und weiß nicht was man noch testen bzw. wo man noch nach dem Fehler suchen sollte.
Hoffe von euch hat jemand eine zündende Idee, ansonsten möge man es als Freitags Thread behandeln
Dank & Grüße,
Andre
auch auf die Gefahr hin dass das hier als Freitagsfrage abgestempelt wird hoffe ich auf brauchbaren Input für diesen - aus meiner bescheidenen Sicht - durchaus kuriosen Fehler.
Wir haben vor einiger Zeit die komplette Betreuung eines Kunden übernommen da der interne IT'ler das Unternehmen verlassen hat. Einige Tage danach hat dieser Fehler begonnen mich verrückt zu machen. Ich werde versuchen die Prolematik so genau wie möglich zu beschreiben, wenn euch weitere Infos interessieren, oder ich etwas vergessen haben sollte, bitte nachfragen.
Kunde setzt 2 CNC Maschinen mit sehr alten Steuerungen ein. Die Steuerung basiert auf 486'er Systemen, die Netzwerkkarten sind tatsächlich noch ISA Karten. Grundsätzlich greifen diese beiden Systeme nur auf das jeweils andere zu (Programm wird an Maschine 1 erstellt und falls notwendig auch auf Maschine 2 via Netzwerk übertragen). Ein Zugriff vom Netzwerk aus auf die beiden CNC Maschinen findet nur 1x pro Woche statt um die erstellten Programme via FTP zu sichern.
Der Aufbau sieht folgendermaßen aus:
CNC Maschine 1 -> Cat5e Kabel -> 8 Port billig Switch
CNC Maschine 2 -> Cat5e Kabel -> 8 Port billig Switch
8 Port billig Switch -> über Dose/Verlegekabel Cat7(vermutlich) -> HP 2530 Switch
Direktes Verkabeln mit dem 2530'er leider nicht möglich, dazu müssten neue Kabel gezogen werden was der Kunde ablehnt.
Der 2530'er ist ein 48 Port Gerät das fast vollständig belegt ist, an keinem der anderen Geräte die dort dran hängen treten Fehler auf.
Die Geräte befindens ich in einem relativ leeren VLAN in dem sich nur ca. 20 andere Geräte befinden, hauptsächlich Switche und andere Netzwerkgeräte.
Dieser Aufbau hat über Jahre hinweg problemlos funktioniert. Seit einiger Zeit ist es nun so dass beide CNC Maschine (erst eine, ca. eine Minute später die andere) die Netzwekverbindung verlieren.
Das äußert sich so dass zwar noch ein Link zur Maschine besteht aber keinerlei Daten mehr übertragen werden, auch ein Ping ist nicht mehr möglich. Weder zwischen den Maschinen noch vom restlichen Netzwerk aus zu den Maschinen. Werden die Maschinen neu gestartet funktioniert alles wieder für einige Minuten, danch der gleiche Fehler wieder.
Interessant daran ist dass sobald die Verbindung des billig Switches zum Netzwerk getrennt wird (also nur die beiden Maschinen alleine an diesem Switch, ohne Vebindung zum Rest der Welt) das Problem nicht auftritt. Hängt man z.B. ein Notebook mit dazu um dort die Sicherung manuell auszuführen tritt das Problem ebenfalls nicht auf. Sobald dann das Patchkabel in Richtung Firmen LAN eingesteckt wird dauert es ca. 1-3 Minuten und beide Geräte sind nicht mehr erreichbar. Auch nicht wenn man alle Kabel trennt und sich direkt mit der Maschine verbindet (Crossover, manuelle Einstellungen Link Speed getestet).
Die Maschinen haben statische IPs und laufen unter einen scheinbar stark umgebauten DOS System. Einzelheiten zum OS kann ich leider nicht wirklich nennen da sich der Hersteller hier ziemlich bedeckt hält. Interessant ist aber dass die es scheinbar hinbekommen haben sowohl ein Dual-Screen Setup als auch Touchscreen Support in das DOS System zu bekommen. Die Aussage dass es DOS (welches auch immer) ist kommt vom Hersteller, gebe das so weiter.
Was wir bisher erfoglos versucht haben:
Austausch billig Switch gegen teureren billig Switch
Austausch billig Switch gegen managebaren Switch, Ports manuell auf 10/100 Mbit/s halb/voll gestellt
Austausch der Netzwerkkarten an den Maschinen und generelle Fehlersuche durch den Support des Herstellers
Austausch aller irgendwie beteiligten Kabel
Sniffen via Wireshark während der Fehler auftritt -> es ist absolut kein einziges Paket von den Maschinen zu sehen
Ausschluss von IP Adress Konflikten
Notebook direkt mit den Maschinen verbunden nachdem der Fehler auftritt -> kein einziges Paket sichtbar
Ich bin hier mittlerweile ziemlich ratlos und weiß nicht was man noch testen bzw. wo man noch nach dem Fehler suchen sollte.
Hoffe von euch hat jemand eine zündende Idee, ansonsten möge man es als Freitags Thread behandeln
Dank & Grüße,
Andre
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 344102
Url: https://administrator.de/forum/cnc-maschinen-verlieren-netzwerkverbindung-kurioser-fehler-344102.html
Ausgedruckt am: 23.12.2024 um 04:12 Uhr
22 Kommentare
Neuester Kommentar
Hallo!
Das Setup ist eine ziemliche Zeitbombe, aber das ist hoffentlich allen beteiligten klar.
Ich würde die beiden Rechner auf Layer 3 zum Rest trennen. Dann hast Du die Unsicherheiten möglichst gut ausgeschlossen. Am besten ein kleiner Mikrotik-Router oder ähnlich statt dem Billigswitch. Dann weißt Du zu 100%, dass nichts zu den Geräten geht an Datenverbindung und Du hast die potentiell angreifbaren Maschinen maximal isoliert.
Grüße
Phil
Das Setup ist eine ziemliche Zeitbombe, aber das ist hoffentlich allen beteiligten klar.
Ich würde die beiden Rechner auf Layer 3 zum Rest trennen. Dann hast Du die Unsicherheiten möglichst gut ausgeschlossen. Am besten ein kleiner Mikrotik-Router oder ähnlich statt dem Billigswitch. Dann weißt Du zu 100%, dass nichts zu den Geräten geht an Datenverbindung und Du hast die potentiell angreifbaren Maschinen maximal isoliert.
Grüße
Phil
Subjektiv: Ich lese nur raus, dass es viele Probleme gibt, der Kunde aber überhaupt keine Lust hat, für irgendetwas zu zahlen.
Heißt für mich: Problem kann nicht so wichtig sein und ihr fahrt langfristig besser damit, wenn ihr die Betreuung einstellt.
Ansonsten hast du dir die Antwort quasi schon gegeben: Häng die Maschinen in ein eigenes VLAN, ACLs drauf und gut ist.
Irgendetwas im Hauptnetz wird wahrscheinlich derart stormen, dass die schwächsten Glieder, in deinem Fall die NICs der Maschinen, den Dienst quittieren.
Heißt für mich: Problem kann nicht so wichtig sein und ihr fahrt langfristig besser damit, wenn ihr die Betreuung einstellt.
Ansonsten hast du dir die Antwort quasi schon gegeben: Häng die Maschinen in ein eigenes VLAN, ACLs drauf und gut ist.
Irgendetwas im Hauptnetz wird wahrscheinlich derart stormen, dass die schwächsten Glieder, in deinem Fall die NICs der Maschinen, den Dienst quittieren.
Hallo,
nichts gegen die Router von MikroTik, aber mit industrietauglichen Technik hat das auch nichts zu tun. Von den Einsatztemperaturen über Staubschutz, EMV, mechanischer Stabilität, IP-Schutzgrad bis zu Ausfallsicherheit durch redundante Stromversorgung erfüllt ein Office-Router - wie die MikroTik-Reihe - keine der Industrieanforderungen. In diesem Scenario sind Office-Router auch nur "Billigheimer"
Zum Testen mag das ja mal gehen; für den Produktiven Einsatz in einer Produktionshalle ein No-Go.
Industriel Ethernet ist eben etwas mehr als Office-IT!
Schau mal hier:
https://www.phoenixcontact.com/online/portal/de/pxc/product_list_pages/! ...
Jürgen
nichts gegen die Router von MikroTik, aber mit industrietauglichen Technik hat das auch nichts zu tun. Von den Einsatztemperaturen über Staubschutz, EMV, mechanischer Stabilität, IP-Schutzgrad bis zu Ausfallsicherheit durch redundante Stromversorgung erfüllt ein Office-Router - wie die MikroTik-Reihe - keine der Industrieanforderungen. In diesem Scenario sind Office-Router auch nur "Billigheimer"
Zum Testen mag das ja mal gehen; für den Produktiven Einsatz in einer Produktionshalle ein No-Go.
Industriel Ethernet ist eben etwas mehr als Office-IT!
Schau mal hier:
https://www.phoenixcontact.com/online/portal/de/pxc/product_list_pages/! ...
Jürgen
Austausch billig Switch gegen managebaren Switch, Ports manuell auf 10/100 Mbit/s halb/voll gestellt
Dann aber bitte auf beiden Seiten, ansonsten hat man ein Duplex-Mismatch und noch größere Probleme. Am besten das Advertising manipulieren, wenn der Switch es kann, dann funktioniert die Auto Negotiation weiter, aber eben nur auf das Gewünschte eingeschränkt.
Wenn das Kabel vom Miniswitch zum HP-Switch 8polig belegt ist und nur die beiden Geräte am Miniswitch hängen, dann einfach mal Cable-Sharing-Adapter einsetzen, dann hängen die Geräte direkt am HP.
Gab es in letzter Zeit irgendwelche Wartungsarbeiten im Unternehmen, bei dem die Maschinen abgeschaltet wurden/stromlos waren oder gab es eine Spannungsspitze?
Hallo,
Hast du dir den Rechner mal genau ansehen können?
Ist das ein Industrie Rechner oder ein umfunktionierter Desktop Rechner?
Evtl ist der Rechner einfach dabei an Altersschwäche zu sterben....
Oder ist die neu eingebaute NIC einfach DoA?
Wurde, vielleicht auch unabhängig von den CNC Maschinen, irgendwelche Umbauarbeiten beim Kunden gemacht?
Strom Kabel gezogen? Motoren oder Pumpen neu eingebaut?
Nicht das du da durch parallel zum Netzwerkkabel Stromführende Kabel hast, die ein Magnetfeld erzeugen und die Netzwerkkommunikation stören?
brammer
Wie oben beschrieben, die Kisten haben einen vollwertigen 486'er PC intern verbaut mit eigener NIC. Keine Konverter. Ich stand daneben als die > Karten getauscht wurden.
Hast du dir den Rechner mal genau ansehen können?
Ist das ein Industrie Rechner oder ein umfunktionierter Desktop Rechner?
Evtl ist der Rechner einfach dabei an Altersschwäche zu sterben....
Oder ist die neu eingebaute NIC einfach DoA?
Wurde, vielleicht auch unabhängig von den CNC Maschinen, irgendwelche Umbauarbeiten beim Kunden gemacht?
Strom Kabel gezogen? Motoren oder Pumpen neu eingebaut?
Nicht das du da durch parallel zum Netzwerkkabel Stromführende Kabel hast, die ein Magnetfeld erzeugen und die Netzwerkkommunikation stören?
brammer
Zitat von @NoHopeNoFear:
Ich habe keine nennenswerten Broadcast Mengen Sniffen können wenn das Hauptnetz mit angeschlossen war.
Ich habe keine nennenswerten Broadcast Mengen Sniffen können wenn das Hauptnetz mit angeschlossen war.
Auch nicht in dem Moment, in welchem die Maschinen nicht mehr erreichbar waren?
Hast du Nagios laufen, um den Uplink-Port des 2530er zum Bllig-Switch zu überwachen? Spanning-Tree und Loopback Detection auf dem 2530er aktiviert?
Grundsätzlich nur danach, ob zum Zeitpunkt des Ausfalls irgendein Gerät massiv viele Pakete verschickt/stormt. Das erkennst du an sehr vielen Einträgen pro Sekunde. Die Farbe spielt dabei allerdings keine Rolle.
Ich hatte mal den Fall, dass eine Klimaanlage eine DHCP-Fehlfunktion hatte und das Netz im Abstand von ca. 5 Minuten mit Broadcasts gestormt hatte.
Wäre nie aufgefallen, wenn wir keine Analog-Telefonieboxen im Einsatz gehabt hätten, die mit 10MBit/s angeschlossen sind und von den Storms komplett lahmgelegt wurden (RX-Portauslastung jeweils 100% = Verbindung unterbrochen).
100MBit/s oder 1GBit/s Geräte zeigten sich davon unbeeindruckt.
Diese DHCP-Einträge z.B. sind im Wireshark blau.
Ich hatte mal den Fall, dass eine Klimaanlage eine DHCP-Fehlfunktion hatte und das Netz im Abstand von ca. 5 Minuten mit Broadcasts gestormt hatte.
Wäre nie aufgefallen, wenn wir keine Analog-Telefonieboxen im Einsatz gehabt hätten, die mit 10MBit/s angeschlossen sind und von den Storms komplett lahmgelegt wurden (RX-Portauslastung jeweils 100% = Verbindung unterbrochen).
100MBit/s oder 1GBit/s Geräte zeigten sich davon unbeeindruckt.
Diese DHCP-Einträge z.B. sind im Wireshark blau.
Hallo,
nur mal so ein Gedankengang:
In den alten Ethernet-Standards war das Frame mit einer max. Größe von 1518 Byte definiert. Mit Einführung von VLAN und QoS wurde die Frame-Größe auf 1522 Byte erhöht.
"Früher", als der RAM noch teuer war, hat man mit der Speicherausstattung der Netzwerkgeräte gegeizt, dh. wenn der Empfangspuffer auf der alten ISA-Netzwerkkarte nur n x 1518 Byte groß ist und, warum auch immer, im Broadcast-Segment getaggte Ethernet-Frames "herumschwirren", könnte es zu einem Pufferüberlauf in der alten NIC kommen. Das könnte wiederum zu einem "Totalausfall" des Protokoll-Stacks führen.
Das entspricht Deiner Fehlerbeschreibung.
Meine These wird auch dadurch gestützt, dass bei alleiniger Verbindung beider Maschinen über einen Switch ohne Verbindung zum übergeordneten Switch der Fehler ja nicht auftritt.
Jürgen
nur mal so ein Gedankengang:
In den alten Ethernet-Standards war das Frame mit einer max. Größe von 1518 Byte definiert. Mit Einführung von VLAN und QoS wurde die Frame-Größe auf 1522 Byte erhöht.
"Früher", als der RAM noch teuer war, hat man mit der Speicherausstattung der Netzwerkgeräte gegeizt, dh. wenn der Empfangspuffer auf der alten ISA-Netzwerkkarte nur n x 1518 Byte groß ist und, warum auch immer, im Broadcast-Segment getaggte Ethernet-Frames "herumschwirren", könnte es zu einem Pufferüberlauf in der alten NIC kommen. Das könnte wiederum zu einem "Totalausfall" des Protokoll-Stacks führen.
Das entspricht Deiner Fehlerbeschreibung.
Meine These wird auch dadurch gestützt, dass bei alleiniger Verbindung beider Maschinen über einen Switch ohne Verbindung zum übergeordneten Switch der Fehler ja nicht auftritt.
Jürgen
Beim Eingesetzten OS könnte sich es um Windows for Pen Computing handeln. Das ist ein Windows was speziell für Touchscreens entwickelt wurde.
en.m.wikipedia.org/wiki/Windows_for_Pen_Computing
en.m.wikipedia.org/wiki/Windows_for_Pen_Computing
moin..
also MS Dos über RS-232 an einen oder 2 Touchscreen für eine CNC-Steuerung war früher Normal!
in der regel wurde MS Dos genommen, später auch mal PC Dos oder DR Dos...
besorg dir mal einen alten 100 MBit HUB... da kommen die beiden CNC Dosen dran, der HUB wird dann mit einem kleinem Switsch verbunden... und der mit dem Router/ Switch in euer Netz!
wenn die Dos CNC kisten NE2000 Nic´s haben- wissen die nix von VLAN´s etc.. was sie aber nicht mögen sind Moderne Switche, Broadcast-Sturm etc.. was ich auch schon mal hatte, waren Potentialprobleme! Während die CNC Fräse in der Werkhalle mit Drehstrom vor sich hindümpelte und das eine oder ander Ampere verbraten hat, wurde in der Konstruktion gesessen, die natürlich im nebenhaus war... 2 Häuser 2 unterschiedliche Erd Potentiale und 4 Netzwerk kabel... das ging jahrelang gut- bis auf einmal nix mehr ging!
nur mal so als Tip...
Frank
Die Maschinen haben statische IPs und laufen unter einen scheinbar stark umgebauten DOS System. Einzelheiten zum OS kann ich leider nicht wirklich nennen da sich der Hersteller hier ziemlich bedeckt hält. Interessant ist aber dass die es scheinbar hinbekommen haben sowohl ein Dual-Screen Setup als auch Touchscreen Support in das DOS System zu bekommen. Die Aussage dass es DOS (welches auch immer) ist kommt vom Hersteller, gebe das so weiter.
also MS Dos über RS-232 an einen oder 2 Touchscreen für eine CNC-Steuerung war früher Normal!
in der regel wurde MS Dos genommen, später auch mal PC Dos oder DR Dos...
Was wir bisher erfoglos versucht haben:
Austausch billig Switch gegen teureren billig Switch
Austausch billig Switch gegen managebaren Switch, Ports manuell auf 10/100 Mbit/s halb/voll gestellt
was selten funktioniert...Austausch billig Switch gegen teureren billig Switch
Austausch billig Switch gegen managebaren Switch, Ports manuell auf 10/100 Mbit/s halb/voll gestellt
besorg dir mal einen alten 100 MBit HUB... da kommen die beiden CNC Dosen dran, der HUB wird dann mit einem kleinem Switsch verbunden... und der mit dem Router/ Switch in euer Netz!
wenn die Dos CNC kisten NE2000 Nic´s haben- wissen die nix von VLAN´s etc.. was sie aber nicht mögen sind Moderne Switche, Broadcast-Sturm etc.. was ich auch schon mal hatte, waren Potentialprobleme! Während die CNC Fräse in der Werkhalle mit Drehstrom vor sich hindümpelte und das eine oder ander Ampere verbraten hat, wurde in der Konstruktion gesessen, die natürlich im nebenhaus war... 2 Häuser 2 unterschiedliche Erd Potentiale und 4 Netzwerk kabel... das ging jahrelang gut- bis auf einmal nix mehr ging!
nur mal so als Tip...
Frank