jordel
Goto Top

Active Directory: Fehler beim Re-Promoten eines Servers

Hallo zusammen,

Wir hatten einige Replikationsprobleme, weshalb ich gestern Nacht einen Domain Controller erst demoten und danach wieder promoten wollte. Leider hat ein geschätzter Kollege das Ganze etwas unglücklich gelöst. Wir hatten einen kompletten Netzwerkausfall, und zusammen mit dem Bereitschaftdienst konnten sie das Netzwerk notgedrungen wieder funktionsfähig machen.

Das Problem bei uns ist, dass wir aufgrund von Platzmangel im Büro alle Server extern haben. Wir haben kein Netzwerk, sondern alles läuft über das Internet (dass das nicht optimal ist, ist mir durchaus bewusst, aber leider gibt es momentan aufgrund von verschiedenen Faktoren keine andere Möglichkeit - wir sind aber dran).

Momentan läuft bei uns gerade mal noch ein einziger DC. Der scheint soweit auch komplett funktionstüchtig zu sein.

Wenn ich jetzt aber probiere, den zweiten DC wieder zu promoten, erhalte ich folgende Fehlermeldung:
The wizard cannot access the list of domains in the forest. The error is: access is denied.

Das Komische ist auch, dass wenn ich auf diesem zweiten DC versuche, AD Users and Computers zu öffnen, ich folgende Fehlermeldung erhalte:
Naming information cannot be located for the following reason: The server is not operational.

Ich kann den ersten DC vom zweiten aus ohne Probleme anpingen.

Habt ihr Ideen?

Vielen, vielen Dank im Voraus & liebe Grüsse

Content-Key: 549202

Url: https://administrator.de/contentid/549202

Printed on: April 24, 2024 at 00:04 o'clock

Member: emeriks
emeriks Feb 19, 2020 at 13:44:32 (UTC)
Goto Top
Hi,
Du wolltest de- und promoten, aber ein Kollege hat es unglücklich gelöst? face-wink

Wo stehen/laufen die DC's?
Wie kommt Ihr ohne Netzwerk ins Internet? Jeder PC über Mobilfunk, oder was?

E.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 updated at 13:51:22 (UTC)
Goto Top
Ähm. Der "zweite DC" war aber hoffentlich nicht der PDC, Infrasturkturmaster oder gar SchemaMaster?

Wenn du auf dem noch laufenden DC mal netdom query fsmo ausführst. Was sagt er dann?
Member: jordel
jordel Feb 19, 2020 at 13:51:19 (UTC)
Goto Top
Ich habe es angeordnet und ein Kollege hat es unglücklich gelöst, so ist es vielleicht besser gesagt.

Wir haben zwei DC: einen in Düsseldorf und einen in Irland.

Ich meinte damit eher, dass wir kein Netzwerk im klassischen Sinn haben, heisst, alle Clients sind in einem Netzwerk und die DCs jeweils in einem eigenen. ;)

Gruß
Member: emeriks
emeriks Feb 19, 2020 at 13:53:43 (UTC)
Goto Top
Zitat von @jordel:
Wir haben zwei DC: einen in Düsseldorf und einen in Irland.
Prima. Und die Clients (Du) sind wo?
Member: jordel
jordel Feb 19, 2020 at 13:54:30 (UTC)
Goto Top
Richtig, der "zweite DC", also derjenige, der entfernt wurde, war der PDC.

Der noch laufende DC nennt sich selbst in allen Punkten.
Schema master               RSC1A-S12.***.com
Domain naming master        RSC1A-S12.***.com
PDC                         RSC1A-S12.***.com
RID pool manager            RSC1A-S12.***.com
Infrastructure master       RSC1A-S12.***.com
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 13:55:22 (UTC)
Goto Top
Und wenn du sagst, der DC "scheint Funktionstüchtig zu sein" Was sagt DCDIAG?
Member: jordel
jordel Feb 19, 2020 at 13:55:36 (UTC)
Goto Top
Die sind in Zürich, Schweiz.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 13:58:08 (UTC)
Goto Top
Die Rollen wurden vor dem Entfernen sauber auf den noch lebenden Server übertragen?
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 14:02:19 (UTC)
Goto Top
Eine Frage noch. Ihr habt aber nicht über ntdsutil nach der "missglückten" Herabstufung noch die Metadaten oder so bereinigt oder?
Member: jordel
jordel Feb 19, 2020 updated at 14:04:05 (UTC)
Goto Top
Folgender Fehler:
Starting test: DFSREvent
There are warning or error events within the last 24 hours after the SYSVOL has been shared.  Failing SYSVOL replication problems may cause Group Policy problems.
......................... RSC1A-S12 failed test DFSREvent

Die Rollen sollten übertragen worden sein, aber sicher bin ich mir seit gestern bei gar nichts mehr.

Es wurde probiert, als ein Fehler auftrat, wurde das DNS Verzeichnis anscheinend manuell bereinigt.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 14:05:31 (UTC)
Goto Top
Mir gehts nicht um DNS. Sondern die Metadaten der Domäne.

Wie zum Beispiel hier beschrieben: https://www.windowspro.de/andreas-kroschel/defekten-domaenencontroller-e ...

Da steht nämlich auch, AUF KEINEN FALL EINEN SERVER DER SO ENTFERNT WURDE WIEDER ANS NETZ NEHMEN!
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 14:07:10 (UTC)
Goto Top
Zitat von @jordel:

Folgender Fehler:
Starting test: DFSREvent
> There are warning or error events within the last 24 hours after the SYSVOL has been shared.  Failing SYSVOL replication problems may cause Group Policy problems.
> ......................... RSC1A-S12 failed test DFSREvent

Die Rollen sollten übertragen worden sein, aber sicher bin ich mir seit gestern bei gar nichts mehr.

Es wurde probiert, als ein Fehler auftrat, wurde das DNS Verzeichnis anscheinend manuell bereinigt.


Der Fehler mit der Replikation an sich ist in dem Zusammenhang nicht "tragisch" der sagt ja nur, dass der Server in den letzten 24 Stunden hatte sein Sysvol zu replizieren. Sei ihm zugestanden, wenn man bedenkt dass ihr einen DC mal eben getötet habt.
Member: emeriks
emeriks Feb 19, 2020 at 14:08:50 (UTC)
Goto Top
Ich tippe mal auf einache Anfängerfehler.
Ich rate wärmstens, einfach die Backups beider DC's, welche Ihr unmittelbar vorher erstellt habt, wiederherszustellen.

Ansonsten:
Wer ist der DNS-Server, welcher die Zone für die AD-Domäne funktionstüchtig hostet?
Member: jordel
jordel Feb 19, 2020 at 14:13:01 (UTC)
Goto Top
Wenn ich die Server mittels
select operation target: list servers in site
aufliste, bekomme ich lediglich den funktionsfähigen DC.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 14:15:45 (UTC)
Goto Top
Und nochmal die Frage. Habt ihr mit ntdsutil ein Metadata-Cleanup durchgeführt? Wenn JA. Werft den alten kaputten DC weg und macht ihn neu!
Member: jordel
jordel Feb 19, 2020 at 14:16:41 (UTC)
Goto Top
Das ist eindeutig ein Anfängerfehler. Nun, die Konsequenzen wird man wohl später daraus ziehen.

Hier kommt das Problem: der Kollege hat durchaus ein Backup erstellt, hat dieses aber nicht noch einmal auf Vollständigkeit überprüft. Es kam beim Backupprozess zu einem Fehler, weshalb es jetzt beschädigt ist. Ohne Worte.

Der funktionsfähige DC übernimmt momentan auch die Funktions des DNS-Servers.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 14:18:11 (UTC)
Goto Top
Ohne Worte... wer solche Kollegen hat, braucht keine Feinde... Mein Beileid.
Member: emeriks
emeriks Feb 19, 2020 at 14:21:24 (UTC)
Goto Top
Dann ist klar:
  1. Backup vom aktuellen Stand DC1 erstellen
  2. Backup vom aktuellen Stand DC2 erstellen
  3. DC2 ausschalten und platt machen! Neu installieren!
  4. dem DC1 alle FSMO "hart" übernehmen lassen
  5. den DC1 zum GC machen
  6. mit NTDSUTIL den DC2 aus dem AD entfernen
  7. DNS aufräumen und alle A- und CNAME-Records zum DC2 löschen
  8. warten, bis der DC1sich als voll funktionstüchtig betrachtet
  9. erst jetzt einen weiteren DC dem AD hinzufügen
Member: jordel
jordel Feb 19, 2020 at 14:22:44 (UTC)
Goto Top
ntdsutil schlug wohl fehl, daraufhin wurde versucht, den Prozess manuell durchzuführen - DNS-Einträge zu löschen, Metadaten, und so weiter.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 14:25:14 (UTC)
Goto Top
Mach es wie emeriks gesagt hat. Einen besseren Rat kann man dir in Moment nicht geben glaube ich. Ausser vielleicht, such dir neue Kollegen face-wink
Member: emeriks
emeriks Feb 19, 2020 updated at 14:28:24 (UTC)
Goto Top
Zitat von @jordel:
ntdsutil schlug wohl fehl, daraufhin wurde versucht, den Prozess manuell durchzuführen - DNS-Einträge zu löschen, Metadaten, und so weiter.
Wie entfernt man manuell die Metadaten, ohne NTDSUTIL?
Und wobei wurde NTDSUTIL verwendet? Ihr wolltet doch demoten?
Member: jordel
jordel Feb 19, 2020 at 14:29:25 (UTC)
Goto Top
Soweit ich das sehe, wurde bis auf das Plattmachen von DC2 eigentlich alles gemacht. Gibt es irgendeine Möglichkeit, die nicht darin endet, DC2 plattzumachen?

Das Problem besteht darin, dass auf dem DC2 auch noch Webdienste gehostet wurden (ja, es ist ohne Worte). Diese Dienste dürfen nicht ausfallen, schon gar nicht während der Produktionszeit.

Gibt es irgendeinen Weg? Ich überlege auch in die Richtung, DC2 einfach so als Webserver stehen zu lassen und einen neuen Server dann als DC zu nutzen. Ist das eine Option, oder haltet ihr DC2 für so beschädigt, dass schon eine blosse Anwesenheit als normale Maschine in AD Probleme auslöst?

Vielen Dank euch beiden übrigens.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 updated at 14:34:16 (UTC)
Goto Top
Also ohne es durch Erfahrung belegen zu können, würde ich schleunigst versuchen den Server aus der Umgebung zu bekommen. Es kann nicht gut gehen, wenn ich einen kaputten DC der nicht mal via NTDSUTIL sauber zu entfernen war, als Zombie im Netzwerk hängen habe.

Webdienste umziehen und gut ist. Wenn es temporär sein soll würde ich zumindest den "Webserver" vom Netzwerk abschotten und dass er garantiert nicht mehr mit dem noch guten DC kommuniziert und die Clients auf die Webservices per NAT oder ähnliches umleiten.

Und kleiner Nachtrag. Ein DC ist ein DC. Darauf dann noch Webdienste zu hosten... mach es künftig lieber anders.
Member: jordel
jordel Feb 19, 2020 at 14:39:08 (UTC)
Goto Top
Vielen Dank für deinen Input. Dann führt wohl kein Weg dran vorbei.

Das mit dem Abschotten wäre in der Tat eine Möglichkeit. Ich schaue mir das mal an.

Das brauchst du mir nicht erzählen - bei uns ist jeder Kollege für bestimmte Dienste und Server zuständig. Der gute Kollege war zu faul, einen 2. Server als Webserver aufzusetzen und hat stattdessen einfach den DC benutzt. Ohne Worte. Nach gestern Nacht hat auch unser CTO unser schwarzes Schaf bemerkt und eine umfassende Untersuchung mit der Möglichkeit von personellen Konsequenzen angekündigt. Immerhin.

Vielen Dank euch auf jeden Fall für die ganze Hilfe!
Member: bloodstix
bloodstix Feb 19, 2020 at 14:39:12 (UTC)
Goto Top
Webdienste auf einen neuen dedizierten Server umzuziehen sollte ja eigentlich nicht das Problem sein.
Member: emeriks
emeriks Feb 19, 2020 at 14:39:33 (UTC)
Goto Top
Zitat von @jordel:
Gibt es irgendeinen Weg? Ich überlege auch in die Richtung, DC2 einfach so als Webserver stehen zu lassen und einen neuen Server dann als DC zu nutzen. Ist das eine Option, oder haltet ihr DC2 für so beschädigt, dass schon eine blosse Anwesenheit als normale Maschine in AD Probleme auslöst?
Kann man so machen. Dann müsstest Du aber sicherstellen, dass dieser nie wieder die AD-Dienste startet.
Besser dann so:
  1. DC2 in eigenes Netz-Segment verfrachten (kein Kontakt zu DC1 !!)
  2. DC2 sich selbst als DNS-Server mit der betreffenden Zone
  3. über DC2(!) denselben Weg gehen wie oben schon beschrieben zum Entfernen des DC2, bloß umgekehrt! Also DC1 rausschmeißen.
  4. Als letztes dann den DC2 demoten und dabei wählen "letzter DC" (sinngemäß). Dabei wird der Server dann zum Standalone-Server.
  5. jetzt könnte man den Server wieder ins richtige Segment hängen (Kontakt zum DC1) und wenn im DC1 schon alles zum DC2 entfernt wurde, dann könnte man den DC2 als Member der Domäne beitreten lassen.

Ob das die installierten Webdienste auf dem DC2 überleben, sei jetzt dahingestellt. Aber da hast Du ja nichts zu verlieren.
Member: Bitboy
Bitboy Feb 19, 2020 at 15:30:12 (UTC)
Goto Top
Was ich mich erstmal frage ist:
Was hat der Kollege auf welche Art unglücklich gelöst?
Welche Troubleshouting Maßnahmen wurden schon unternommen?
Wie ist letztlich der Status von DC2?
Member: jordel
jordel Feb 19, 2020 at 17:14:24 (UTC)
Goto Top
Ich habe ein neues Problem. Beim Promoten eines komplett neuen DCs erhalte ich jetzt die folgende Fehlermeldung:
The operation failed because:

Active Directory Domain Services could not replicate the directory partition CN=Schema,CN=Configuration,DC=contonso,DC=com from the remote Active Directory Domain Controller RSC1A-S12.contonso.com.

"The replication operation failed to allocate memory."  

Hat jemand da eine Idee?
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 17:16:43 (UTC)
Goto Top
Hast du den funktionierenden DC wirklich sauber mit ntdsutil bereinigt?
Member: jordel
jordel Feb 19, 2020 at 17:16:47 (UTC)
Goto Top
Das kann ich dir auch nicht genau sagen. Soweit ich weiss, hat er versucht, den DC zu demoten, hat dann aber gemerkt, dass normales Demoten nicht funktioniert und dann das Ganze erzwungen.
In den nachfolgenden Stunden war das komplette Active Directory nicht mehr verfügbar. Zusammen mit dem Bereitschaftsdienst haben sie den eigentlich sekundären DC zum einzigen DC gemacht, damit wenigstens die Anmeldung wieder funktioniert.
Member: jordel
jordel Feb 19, 2020 updated at 17:19:12 (UTC)
Goto Top
Ich habe folgendes gemacht:
ntdsutil: metadata cleanup
metadata cleanup: connections
server connections: connect to server localhost
server connections: q
metadata cleanup: select operation target
select operation target: list domains
select operation target: select domain 0
select operation target: list sites
select operation target: select site 0
select operation target: list servers in site

Als Ergebnis wurde mir dann nur mein funktionierender DC angezeigt. Keine Spur vom DC2. Eigentlich müsste der damit ja weg sein, oder nicht?
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 17:20:10 (UTC)
Goto Top
Das ist ja schon mal gut.

Über welches Betriebssystem sprechen wir denn genau? 2012? 2012r2? 2016? 2019?
Member: jordel
jordel Feb 19, 2020 at 17:22:17 (UTC)
Goto Top
2019er wäre das.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 17:24:58 (UTC)
Goto Top
Schau mal hier, das hört sich ähnlich an wie bei dir

https://social.technet.microsoft.com/Forums/en-US/a2f0c410-a16f-47c3-b98 ...

Könnte ein Artefakt des alten DC sein.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 17:29:25 (UTC)
Goto Top
Vergiss es. War ein anderes Problem. Wenn man am Smartphone googelt...

Dein Fehler deutet auf Arbeitsspeicherprobleme hin. Neugestartet hast du den neuen alten DC mal kürzlich?
Member: jordel
jordel Feb 19, 2020 at 17:33:44 (UTC)
Goto Top
Ich hab das mal geprüft - Arbeitsspeicher ist in der Tat ziemlich ausgelastet. Ich habe die Grösse des Servers mal erhöht, mal schauen, ob das hilft.
Member: TRDSRLZ
TRDSRLZ Feb 19, 2020 at 17:35:12 (UTC)
Goto Top
Geh das mal Schritt für Schritt durch

https://www.windowspro.de/andreas-kroschel/defekten-domaenencontroller-e ...

So entferne ich immer "überbleibsel" wie 2003er DCs die nur ausgeschaltet und nie sauber entfernt wurden.
Member: emeriks
emeriks Feb 19, 2020 at 22:17:42 (UTC)
Goto Top
Zitat von @jordel:
Als Ergebnis wurde mir dann nur mein funktionierender DC angezeigt. Keine Spur vom DC2. Eigentlich müsste der damit ja weg sein, oder nicht?
Nö. Ich schätze, Ihr habt im AD auch meherer Sites abgebildet?
Falls ja, dann musst Du natürlich die Site auswählen, wo der DC2 zugehört. Und dort sollte Dir der DC1 gar nicht aufgelistet werden.