spsman
Goto Top

Wo ist der Flaschenhals im Netzwerk

Hi,

folgende Systemkonfiguration:

- 24 Arbeitsstationen
- 6Drucker + 2Nas
- 6 virtuelle Server: DHCP, Exchange, 4x Datenbank
- 2 Blechserver ( Haupt-Aktiv und Back-Up)
- 1x Firewall( regelt intern WLAN)
- 2 Cisco SG300

-> Keine VLan
Nun haben wir immer wieder(Teilweise 10x in 10 min.) das Problem, dass die Datenbankanwendungen(Eplan/WSCAD) "Hacken" oder die Fehlermeldungen "PEER Closed" bringen. Die Netzwerkkabel sind sauber ( haben Wir schon messen lassen).

Der Server hat 9 Netzwerkkarten und somit hat jede Hyper-V VM Ihre eigene NW-Karte Zugewiesen...

Antworten die evtl. Festplatten zu langsam? (8x10K SAS Platten)

Wo und wie kann ich den Fehler weiter eingrenzen?

Wenn die Datenbanken Lokal laufen 0 Fehler...

Gruß Rob

Content-ID: 620736

Url: https://administrator.de/contentid/620736

Ausgedruckt am: 21.11.2024 um 17:11 Uhr

146189
146189 09.11.2020 aktualisiert um 11:42:17 Uhr
Goto Top
Wo ist der Hacken ...
"Hacken"
Hier oder hier
chgorges
chgorges 09.11.2020 aktualisiert um 11:47:16 Uhr
Goto Top
Zitat von @SPSman:

Hi,
Hi,
- 6 virtuelle Server: DHCP, Exchange, 4x Datenbank
Antworten die evtl. Festplatten zu langsam? (8x10K SAS Platten)

Hihi, sorry, wer hat den Schwachsinn geplant? Auf 10k Platten würde ich mich nichtmal trauen, einen Exchange- und einen DB-Server parallel laufen zu lassen und ihr gebt ihm vier DB-Server dazu :D

VG
Coreknabe
Coreknabe 09.11.2020 um 11:55:37 Uhr
Goto Top
Moinsen!

@chgorges
Auf 10k Platten würde ich mich nichtmal trauen, einen Exchange- und einen DB-Server parallel laufen zu lassen und ihr gebt ihm vier DB-Server
dazu :D

Würde ich so nicht unterschreiben, das sollte nicht zwingend beinhalten, dass alles laufend abkackt.
Frage ist doch, wie das ganze dimensioniert und umgesetzt ist. Ein Exchange. Aha. Und wie viele Postfächer laufen da drauf? 3? 300? 3000?
"Datenbank". Was für ne Datenbank? Was passiert auf denen? Wie groß sind die? Laufen da eigene Skripte?
In welchem RAID-Modus laufen die Platten? Die laufen doch in nem RAID? Ja? face-smile

Alles in allem sind Flashspeicher natürlich eher Stand der Technik, zumindest für die VMs. Dass die Datenbankanwendungen Hacken bringen, ist allerdings ein starkes Stück!

Gruß
Lochkartenstanzer
Lochkartenstanzer 09.11.2020 um 11:56:13 Uhr
Goto Top
Zitat von @SPSman:

Der Server hat 9 Netzwerkkarten und somit hat jede Hyper-V VM Ihre eigene NW-Karte Zugewiesen...

Sind das Karten mit offload-Prozessing? Ansonsten dürfte das das Problem sein,w en da 0815-realtek-Karten verbaut wurden. face-smile

Hängen die alle am gleichen switch?

Warum macht ihr nciht einfach bonding statt so einem quatsch die alle an den gleichen switch zu hängen?

lks
Lochkartenstanzer
Lochkartenstanzer 09.11.2020 aktualisiert um 12:05:40 Uhr
Goto Top
Zitat von @Coreknabe:

Alles in allem sind Flashspeicher natürlich eher Stand der Technik, zumindest für die VMs. Dass die Datenbankanwendungen Hacken bringen, ist allerdings ein starkes Stück!

Ja Hacken gehören in den Garten und nicht in eine Datenbank - außer man ist ein Baumarkt.

lks

PS:


Man sollte seien Fragen schon sorgfältige formulieren.
Coreknabe
Coreknabe 09.11.2020 um 12:02:03 Uhr
Goto Top
Ach, so schlimm finde ich das gar nicht, habe ja auch unsauber formuliert.
Würde ich so nicht unterschreiben, das sollte nicht zwingend beinhalten, dass alles laufend abkackt.

Korrektur: ... dass alles laufend abhackt.

So.
SPSman
SPSman 09.11.2020 um 12:38:19 Uhr
Goto Top
Hacken im Sinne von Stocken...

- Exchange mit 50 Postfächern
-> Raid 10
@Lochkartenstanzer
-> es sind 2x 4'er "Broadcom NetXtreme Gigabit Ethernet" ind der IDrag vom Server
=> Die DB Server gehen auf den Switch mit den DB-Usern

Laut "Dell optics Live Messung" Idlen alle Server eigentlich nur vor sich hin, bis auf Abend wen das Backup Läuft und keiner mehr in der Firma ist.

Deshalb kommen für mich eigentlich nur 2 Fehlerquellen in Frage:
- I/O-Performance (Wie kann ich die übers Netzwerk Messen?)
- Netzwerktraffic / Paketquerschläger oder so...

Gruß Rob
Knorkator
Knorkator 09.11.2020 aktualisiert um 12:55:02 Uhr
Goto Top
Schau Dir doch einfach mal die entsprechenden Werte mittels Perfmon an..

https://docs.microsoft.com/en-us/windows-server/administration/performan ...

Puh.. 9 Netzwerkschnittstellen... wer hat die das denn empfohlen?
Wie lks schon schrieb... was sind das denn für welche?

Was hast Du denn für ein Raid im Einsatz?
Steckt da ein gescheiter Controller hinter?
SPSman
SPSman 09.11.2020 um 13:29:35 Uhr
Goto Top
Hi,
- Raid 10 im Dell PERC H730P
-> Ist ein Komplettpaket von Dell mit "Broadcom 5719 QP"-Netzwerkkarte
Knorkator
Knorkator 09.11.2020 um 13:39:40 Uhr
Goto Top
Also ein Raid 10 mit 8 Platten pro Host?

Welcher Hyper-V ist das denn?
Gui oder Core?

Schau Dir mal die typischen Performance Counter an.. Die aktuelle Warteschlangenlänge der Physikalischen Datenträgers wäre schonmal was..
142583
142583 09.11.2020 um 13:49:21 Uhr
Goto Top
Zitat von @chgorges:

Zitat von @SPSman:

Hi,
Hi,
- 6 virtuelle Server: DHCP, Exchange, 4x Datenbank
Antworten die evtl. Festplatten zu langsam? (8x10K SAS Platten)

Hihi, sorry, wer hat den Schwachsinn geplant? Auf 10k Platten würde ich mich nichtmal trauen, einen Exchange- und einen DB-Server parallel laufen zu lassen und ihr gebt ihm vier DB-Server dazu :D

VG

Warum sehe hier stabile 1000 IOPS.
142583
142583 09.11.2020 um 13:51:41 Uhr
Goto Top
Zitat von @SPSman:

-> Keine VLan
Nun haben wir immer wieder(Teilweise 10x in 10 min.) das Problem, dass die Datenbankanwendungen(Eplan/WSCAD) "Hacken" oder die Fehlermeldungen "PEER Closed" bringen. Die Netzwerkkabel sind sauber ( haben Wir schon messen lassen).

Der Server hat 9 Netzwerkkarten und somit hat jede Hyper-V VM Ihre eigene NW-Karte Zugewiesen...

Details? Mehr Details.
Der Client zeigt die Meldung?

Wie muss man sich im Details die neun Netzwerkkarten vorstellen? Wie ist die detaillierte Konfig?
rzlbrnft
rzlbrnft 09.11.2020 um 14:15:24 Uhr
Goto Top
Zitat von @SPSman:

Hi,
- Raid 10 im Dell PERC H730P
-> Ist ein Komplettpaket von Dell mit "Broadcom 5719 QP"-Netzwerkkarte

Ich würde aus Prinzip mal die Broadcoms vermuten, aus dem einfachen Grund das wir mit Broadcom Karten auch nur Probleme hatten.
Da ich keinen Bock hatte lang mit Settings rumzuprobieren hab ich in unserem Fall die Karten gegen Intel X540 ausgetauscht und danach keine Probleme mehr gehabt. Du kannst dich aber natürlich mal mit dem Hersteller bezüglich der empfohlenen Einstellungen in Verbindung setzen.
Konkret gings da um Virtual Machine Queing, alles was mit Offloading zu tun hat und Wait Times.
SPSman
SPSman 09.11.2020 aktualisiert um 14:46:19 Uhr
Goto Top
Raid 10 mit 8 Platten im Hauptserver. Es ist ein Cold-Standby Scenario, also inderessiert der Back-Up server Wenig, dort werden die VM alle 5 Min Repliziert. (Über eine eigene Netzwerkschnittstelle).

@142583 Ja Warum nur und wo sehe ich das?
Hyper-v WinServer 1607 mit GUI. Ja der Client bringt die Meldung

Korrektur:-> es sind 1x 4'er "Broadcom NetXtreme Gigabit Ethernet" , 2x Intel(R) Gigabit 2P I350-t LOM onboard und der IDrag vom Server

Netzwerk im Hyper-V: Siehe Anhang
1 Netzwerkschnittstelle pro VM
hv-nw
NetzwerkDude
NetzwerkDude 09.11.2020 um 15:55:00 Uhr
Goto Top
Erstmal würde ich schauen obs Netzwerk oder die DBs (also Platten, CPU Resourcen etc.) sind:
Daher auf dem Server Netzwerk mitschneiden und auf dem Client Netzwerk mitschneiden - falls die Paketlaufzeiten i.O. sind und auch keine Paketverluste/retransmits/sonstigerkram sind, dann sollte das Netzwerk sauber sein. (Meisten schaut man da auf dem Server und die Zeit zwischen "Paket kommt vom Client, wie lange dauerts bis die Antwort verschickt wird?" - da hilft die Deltaspalte im Wireshark ungemein

Dann gehts um die Performance der DBs - da kommts drauf an welches OS es ist, bei Linux kannst mit perf und strace mal schauen was die Anwendungen so machen. Bei Windows... kann man sicher auch irgendwie tracen :D

MFG
N-Dude
psannz
psannz 09.11.2020 aktualisiert um 16:22:58 Uhr
Goto Top
Sers,

da das Broadcom 1Gbit NICs sind, bitte darauf achten. dass VMQ aus ist. Der Bug besteht nach wie vor.

Grüße,
Philip
IntelOutside
IntelOutside 09.11.2020 um 16:58:34 Uhr
Goto Top
Wo ich noch schauen würde :

Was habt ihr für eine Antivirussoftware auf den Clients und/oder Server laufen ?
Sofern dort noch eine "intelligente" Firewall mitinstalliert wird blockt u.U. ein IDS Modul sporadisch die Kommunikation, weil zuviele Anfragen an die Datenbank als "Angriff " gewertet werdem !
142583
142583 09.11.2020 um 20:00:45 Uhr
Goto Top
Zitat von @SPSman:

Raid 10 mit 8 Platten im Hauptserver. Es ist ein Cold-Standby Scenario, also inderessiert der Back-Up server Wenig, dort werden die VM alle 5 Min Repliziert. (Über eine eigene Netzwerkschnittstelle).

@142583 Ja Warum nur und wo sehe ich das?
Hyper-v WinServer 1607 mit GUI. Ja der Client bringt die Meldung

Korrektur:-> es sind 1x 4'er "Broadcom NetXtreme Gigabit Ethernet" , 2x Intel(R) Gigabit 2P I350-t LOM onboard und der IDrag vom Server

Netzwerk im Hyper-V: Siehe Anhang
1 Netzwerkschnittstelle pro VM

Also die Client Software?
Was sagt der Hersteller zu dieser Meldung?

Bezüglich der NICs. Wie ist die Konfig des Ganzen? Sind die Firmware aktuell? Sind die Treiber von Dell oder von Windows Update?
Welche Sachen sind am Hypervisor eingestellt?

kannst du testweise mal nur mit den Intel Karten und testweise nur mit dem Broadcom Karten arbeiten?
Mika909
Mika909 10.11.2020 um 14:51:47 Uhr
Goto Top
Moin,

wie wird die DB von Eplan bzw WSCAD denn eingebunden? Über die VM´s? Hoffentlich über einen SQL-Server?!? Darüber habe ich noch wenig gelesen. Geschwindigkeitstest mit Perfmon, wie bereits vorgeschlagen durchgeführt? Eventuell "hacken" die Anwendungen, wenn zu dieser Zeit im Netzwerk Traffic entsteht (NAS macht iwas... etc.) d.H. den Netzwerktraffic zu den verdächtigen Zeiten sniffen und schauen, ob man das Problem eingrenzen kann. Ist das Problem reproduzierbar oder taucht es sporadisch auf?

gruß
samet22
samet22 11.11.2020 um 10:26:17 Uhr
Goto Top
Frage, habt ihr am Hyper-V NIC-Teaming aktiviert?
jmueller
jmueller 16.11.2020 um 11:17:56 Uhr
Goto Top
Hallöle,

Wo ist der Flaschenhals???

Möglichkeit 1: Das RAID, hast du alle Platten als 1 RAID-10 konfiguriert oder sinds 2?

Möglichkeit 2: Hängen alle Netzwerkports am selben Switch? (Ich denke das hier die Problematik liegt)

Möglichkeit 3: Das EPLAN / WSCAD läuft das auf dem Server oder ist das lokal auf den WS installiert? Wenns auf dem Server läuft könnte auch das die ursache sein.

Beste Grüße
jschneppe