marco123
Goto Top

Heartbeat deklaiert 2. node als dead

Hallo,

Ich wollte heartbeat auf 2 nodes konfigurieren, jedoch sagen die Nodes, dass die gegenpartei tot ist, obwohl die online sind :/

die konfiguration von ha.cf haresources sowie authkeys stimmt. auch die rechte sind vergeben: 600 authkeys.

in den Logdateien ist leider nichts zu erkennen.
ich habe schon auf crc umgestellt jedoch auch ohne erfolg.

im sniffer sehe ich die udp pakete auf port 694 ankommen, auf beiden nodes.

HA.CF (mx1)
udpport 694
ucast eth0 10.12.0.12
node ha-mx1
node ha-mx2
ping 10.12.0.1
respawn hacluster /usr/lib/heartbeat/ipfail
keepalive 2
deadtime 30
auto_failback on

HA.CF (mx2)
udpport 694
ucast eth0 10.12.0.11
node ha-mx1
node ha-mx2
ping 10.12.0.1
respawn hacluster /usr/lib/heartbeat/ipfail
keepalive 2
deadtime 30
auto_failback on


(Diese sind auf beiden Nodes gleich)

haresources
ha-mx1 10.12.0.10

authkeys
auth 1
1 crc

LOG auf mx1
ResourceManager[20270]: 2009/12/22_11:06:12 debug: /etc/ha.d/resource.d/IPaddr 10.12.0.10 start done. RC=0
ipfail[20123]: 2009/12/22_11:06:13 debug: Cluster node: 10.12.0.1: status: ping
ipfail[20123]: 2009/12/22_11:06:14 debug: Cluster node: ha-mx2: status: dead
ipfail[20123]: 2009/12/22_11:06:14 debug: [They are ha-mx2]
ipfail[20123]: 2009/12/22_11:06:14 debug: Cluster node: ha-mailone: status: active
ipfail[20123]: 2009/12/22_11:06:15 debug: Setting message signal
ipfail[20123]: 2009/12/22_11:06:15 debug: Waiting for messages...
heartbeat[20022]: 2009/12/22_11:06:22 info: Local Resource acquisition completed. (none)
heartbeat[20022]: 2009/12/22_11:06:22 info: local resource transition completed.


in der IPTqables habe ich die udp pakete auch erlaubt:
iptables -A INPUT -p udp --dport 694 -j ACCEPT
iptables -A INPUT -p udp --sport 694 -j ACCEPT


vielen dank !!!!!!!!!!!!!

Content-ID: 132127

Url: https://administrator.de/contentid/132127

Ausgedruckt am: 22.11.2024 um 15:11 Uhr

Marcel84
Marcel84 22.12.2009 um 12:52:51 Uhr
Goto Top
Möglicherweise Windows Firewall aktiv und ICMP Echo off?
Marcel84
Marcel84 22.12.2009 um 12:55:31 Uhr
Goto Top
Sorry hab nicht gesehen, dass dies auf nem Linux Sys läuft, in dem Fall nix mit windows firewall face-smile
Marco123
Marco123 22.12.2009 um 16:16:25 Uhr
Goto Top
Hey,

hab "fast" den Fehler gefunden, liegt an der Firewall :/

nur benötige ich die Regeln um heartbeat zuzulassen
für input und output, genutzt wird ucast auf dem port 694.

wer kann mir die Regeln sagen*G* bittteee

iptables -
iptables-

dankeee
alex-w
alex-w 07.01.2010 um 14:30:51 Uhr
Goto Top
Hi in der 'Configdatei für die zweite Node musst du die Reihenfolge der Nodes umkehren.

Also so:

HA.CF (mx1)
udpport 694
ucast eth0 10.12.0.12
node ha-mx1
node ha-mx2
ping 10.12.0.1
respawn hacluster /usr/lib/heartbeat/ipfail
keepalive 2
deadtime 30
auto_failback on

HA.CF (mx2)
udpport 694
ucast eth0 10.12.0.11
node ha-mx2
node ha-mx2
ping 10.12.0.1
respawn hacluster /usr/lib/heartbeat/ipfail
keepalive 2
deadtime 30
auto_failback on

und evtl. musst du als ping die jeweilig andere Adresse der Node angeben.

Gruß Alex
Marco123
Marco123 07.01.2010 um 19:56:11 Uhr
Goto Top
Zitat von @alex-w:
Hi in der 'Configdatei für die zweite Node musst du die Reihenfolge der Nodes umkehren.

Also so:

HA.CF (mx1)
udpport 694
ucast eth0 10.12.0.12
node ha-mx1
node ha-mx2
ping 10.12.0.1
respawn hacluster /usr/lib/heartbeat/ipfail
keepalive 2
deadtime 30
auto_failback on

HA.CF (mx2)
udpport 694
ucast eth0 10.12.0.11
node ha-mx2
node ha-mx2
ping 10.12.0.1
respawn hacluster /usr/lib/heartbeat/ipfail
keepalive 2
deadtime 30
auto_failback on

und evtl. musst du als ping die jeweilig andere Adresse der Node angeben.

Gruß Alex


Hallo Alex,

Da liegst du falsch, der 2. Node Ignoriert den Namen des anderen Host.

Der Eintrag Ping:
darf NICHT auf den anderen Node zeigen, dieser MUSS auf z.b den Gateway zeigen!

da dies eine überprüfungvariable ist, damit die Nodes sehen ob sie selbst die möglichkeit haben aktiv zu werden.
solltest du dies auf dem 2. Node auf den ersten Node, zeigen lassen, und der 2. Node merkt durch den heartbeat, dass der 1. Down ist, prüft er erst ob er selbt die verbindung zum internet hat. dies ist der Ping entry.
sollte der Ping eintrag auf den 1. Node verweißen, sagt der 2. " Sry ich bin selber nicht fähig zu arbeiten "

Mit freundlichen Grüßen

Marco
alex-w
alex-w 07.01.2010 um 20:15:49 Uhr
Goto Top
Ok das mag stimmen aber deine Konfig hat trotzdem oben genannten Fehler. Sprich die Reihenfolge der Nodes in den Configs muss anders sein.

Gruß