alithanar99
Goto Top

ntbackup - Ultrium 3 Probleme bei mehr als 10 GB Daten

Hallo

Bei unserer Datensicherung sichern wir die Serverlaufwerke zentral mittels ntbackup, als bkf Dateien, auf einem Sicherungsserver (Win2K Server). Dabei werden ein Teil der Daten vom Sicherungsserver gezogen und andere Daten von den jeweiligen Server auf eine Freigabe auf dem Sicherungsserver abgelegt. Anschliessend werden die Dateien (ebenfalls per ntbackup) auf einem externen IBM LTO-3 Ultrium SCSI Laufwerk gesichert (Modelnummer 3580). Die ersten 8 Wochen lief die Sache auch wunderbar durch. Aber seit ca. einer Woche zickt das Laufwerk ( ? ) rum. Ich bekomme beim Schreiben der Daten auf das Laufwerk nach ca. 10 GB folgende Fehlermeldung :

"Fehler: Das Gerät meldete einen Fehler bei der Durchführung folgender Aufgabe: Daten auf das Medium schreiben..
Fehlermeldung: Fehlerhafte Daten.".

Danach möcht das Laufwerk gerne ein Reinigungsband haben, säubert sich und das Spiel kann von vone losgehen.

Der IBM Support hat das Laufwerk schon tauschen lassen. Ich habe auch schon mehrere Bänder LTO 3 / 2 probiert, das Laufwerk an einem anderen Server und mit einem anderen Kabel angeschlossen und zu guter letzt auch den Terminator getauscht, trotzdem tritt immer wieder der Fehler auf. An der Hard / Software wurde nichts geändert. Am SCSI Anschluss ist dies das einzige Gerät (ID 6). Chkdsk meldet keine Fehler auf der Platte. Der SCSI Port ist auch nicht doppelt belegt. Die Windows Ereignisanzeige zeigt mir nichts an face-sad Der Fehler tritt auch bei Bändern auf, die vorher sauber beschrieben wurden.

Hat von euch eventuell jemand eine Idee, und kann mir einen Tip geben was ich noch probieren kann, bzw. wo ich den Fehler noch suchen kann?

Danke
Thomas

Content-ID: 67685

Url: https://administrator.de/contentid/67685

Ausgedruckt am: 15.11.2024 um 17:11 Uhr

Weasel1969
Weasel1969 03.09.2007 um 00:01:46 Uhr
Goto Top
Hallo


du schreibst :

"Dabei werden ein Teil der Daten vom Sicherungsserver gezogen und andere Daten von den jeweiligen Server auf eine Freigabe auf dem Sicherungsserver abgelegt. Anschliessend werden die Dateien (ebenfalls per ntbackup) auf einem externen IBM LTO-3 Ultrium SCSI Laufwerk gesichert"

Aufgrund deiner bisherigen Maßnahmen möchte ich HW-Fehler auch ausschliessen.

Kann es denn sein, das zum Zeitpunkt der Datensicherung evtl noch Dateien offen sind ? ( Datenbank, andre Jobs, etc. ? )

Hast du schon mal getestet,. die Datensicherung nach zeitmäßig nach hinten zu verlegen ?

NTBackup ist leider nicht sehr auskunftfreudig.

Schonmal Veritas ( Symantec face-sad( ) Backup Exec im Einsatz gahabt. Kannst du als Trial testen. Setzt den Job mal darunter auf und schau, was dort passiert. Evtl. ist die Fehlermeldung detaillierter .

Gruß,
Andy
Equinox
Equinox 04.09.2007 um 12:10:43 Uhr
Goto Top
Grüße,

wie Andy zuvor würde auch ich einen HW-Fehler ausschliessen.

Mich würde interessieren was in der Zeit geändert wurde auf den Servern.
Ich gehe jetzt mal davon aus, das die Sicherung immer zum gleichen Zeitpunkt läuft und dadurch auch das Zeitfenster nach hinten zu verlegen, vielleicht nichts ändert.

Kann man im Log wo sehen ob es immer an der gleichen Stelle beim Sichern ist? ( bestimmte Datei?..) Vielleicht wurde ein irgend ein Softwarepacket einen Update unterzogen das jetzt den Fehler macht.
Hier könnte man dann probeweise versuchen die Datei/Ordner von der Sicherung auszuschließen.

Wie sieht es mit einer Testsicherung unter Tags aus von dem Server? Kommt da der gleiche Fehler?

Equinox
AlithAnar99
AlithAnar99 04.09.2007 um 23:03:15 Uhr
Goto Top
Hallo

Das is ja das Komische
wir haben auf dem Server in der Zeit nichts geändert.

Das Logfile ist ziehmlich bescheiden und sagt eigentlich nichts aus.

Ich kann es ja morgen mal posten.
Ich hab mir gerade die Trail von Backup Exec und werde mir (obwohl es ein Symantec Produkt ist) mal installieren und schauen ob ich da was detailiertes bekomme.

Die Daten befinden sich zur Zeitpunkt der Sicherung nicht im Zugriff, da der Fehler auch auftritt, wenn ich die bkf Datei die ich sichern möchte auf einen anderen Server kopiere und das Band dann dort anschliesse und die Sicherung beginne.
Ich hab jetzt auch schon mal ein ganzen Haufen kleine Dateien gesichert (persönliche Ordner etc. ) was aller höchstens dazu führt, das der Fehler evtl erst nach 11 oder 12 GB auftritt. face-sad

Ich werd euch morgen informieren wie die Sache weitergeht.

Thomas
Ickmus
Ickmus 05.09.2007 um 08:52:42 Uhr
Goto Top
Hallo,

wenn der Fehler auftritt, ist dann in den Single Character Display des Laufwerk eine Fehlernummer zu sehen, bzw. ein C?
Hat IBM schonmal nach Drive Dumps gefragt um das interne Errorlog des Laufwerkes zu analysieren?
Schonmal den Selbsttest der Laufwerke durchgeführt?
Wie schnell laufen denn die Backups im Durchschnitt?

Es wird von den meisten Herstellen von Backupsoftware empfohlen SCSI ID6 nicht für Bandgeräte zu nutzen, da diese SCSI-ID für das SCAM-Protokoll reserviert ist (http://de.wikipedia.org/wiki/Small_Computer_System_Interface) , http://support.veritas.com/docs/278111 ,..)

K.
AlithAnar99
AlithAnar99 05.09.2007 um 19:58:35 Uhr
Goto Top
So Symantec BAckup Exec 11d installiert.
Gleiches Problem face-sad

Hier mal das komplette Protokoll (eigentlich eine xml Datei):

<?xml version="1.0" encoding="UTF-16" ?>
- <joblog>
<job_log_version version="2.0" />
- <header>
<filler>======================================================================</filler>
<server>Auftragsserver: Sicherungsserver</server>
<name>Auftragsname: Sichern 00001</name>
<start_time>Auftrag gestartet am Mittwoch, 5. September 2007 um 19:13:14</start_time>
<type>Auftragstyp: Sichern</type>
<log_name>Auftragsprotokoll: BEX_Sicherungsserver_00001.xml</log_name>
<filler>======================================================================</filler>
</header>
<media_mount_date>Laufwerk und Laden von Medium angefordert: 05.09.2007 19:13:14</media_mount_date>
- <media_drive_and_media_info>
<media_mount_date>Laufwerks- und Medieninformationen von Medienladevorgang: 05.09.2007 19:13:30</media_mount_date>
<drive_name>Laufwerkname: IBM 1</drive_name>
<media_label>Medienkennung: Seagate 2007/08/24.07:05:08</media_label>
<media_guid>Medien-GUID: {e28b2fc0-f765-4dab-9652-9ef638ed599c}</media_guid>
<media_overwrite_date>Überschreibschutz bis: 31.12.9999 01:00:00</media_overwrite_date>
<media_append_date>Anhängbar bis: 31.12.9999 01:00:00</media_append_date>
<media_set_target>Name des Ziel-Mediensatzes: Daten unbegrenzt aufbewahren - kein Überschreiben zulassen</media_set_target>
</media_drive_and_media_info>
- <backup>
<filler>======================================================================</filler>
<title>Auftragstyp - Sichern</title>
<append_or_overwrite>Medienvorgang - Überschreiben.</append_or_overwrite>
<compression>Komprimierungstyp: Hardware [falls vorhanden, sonst keine]</compression>
<filler>======================================================================</filler>
- <machine>
<machine_name>Sicherungsserver</machine_name>
- <set>
<set_resource_name>F: Sicherung</set_resource_name>
<tape_name>Familienname: "Medium erstellt am 05.09.2007 um 19:13:14"</tape_name>
- <volume>
<display_volume>Sicherung von "F: Sicherung"</display_volume>
</volume>
<description>Sicherungssatz Nr. 1 auf Speichermedium Nr. 1 Beschreibung des Sicherungssatzes: "Sichern 00001"</description>
<backup_type>Sicherungsmethode: Gesamt - Dateien sichern - Archivbit zurücksetzen</backup_type>
<start_time>Sicherung begonnen am 05.09.2007 um 19:13:34.</start_time>
<OperationErrors Type="drive_error">Auf Gerät "IBM 1" trat ein unbekannter Fehler auf.</OperationErrors>
- <OperationErrors Type="error">
<UMI>V-79-57344-34028</UMI>
- Ein Lese-/Schreibfehler trat auf. Dies ist in der Regel auf schmutzige Lese-/Schreibköpfe im Medienlaufwerk zurückzuführen. Reinigen Sie das Medienlaufwerk und wiederholen Sie den Auftrag. Besteht das Problem anschließend weiterhin, verwenden Sie ein anderes Medium. Möglicherweise kann der Fehler auch durch Probleme mit Kabeln, Terminierung oder anderer Hardware verursacht werden.
</OperationErrors>
<end_time>Sicherung abgeschlossen am 05.09.2007 um 19:22:37.</end_time>
- <summary>
<misc>0 Dateien in 2 Verzeichnissen gesichert.</misc>
<new_processed_bytes>10.007.474.154 Byte verarbeitet in 9 Minuten und 3 Sekunden.</new_processed_bytes>
<vlm_hist_rateformat2>Durchsatzrate: 1055 MB/Min.</vlm_hist_rateformat2>
</summary>
<empty_set_warning>Dieser Sicherungssatz enthält eventuell keine Daten.</empty_set_warning>
<filler>----------------------------------------------------------------------</filler>
</set>
</machine>
</backup>
- <tape_alerts>
<tape_alert_header>----- TapeAlert-Ereignisse----- Das Gerät hat die folgenden TapeAlert-Diagnoseinformationen ausgegeben. Weitere Informationen zu TapeAlerts erhalten Sie beim Hersteller des Geräts.</tape_alert_header>
<tape_alert_message>Warnung - Beim Medienlaufwerk liegt evtl. ein Hardwarefehler vor. Führen Sie das erweiterte Diagnoseprogramm aus, um das Problem herauszufinden. Schlagen Sie im Benutzerhandbuch des Medienlaufwerks nach gerätespezifischen Anweisungen zum Ausführen von erweiterten Diagnosetests nach. Wechsler: Laufwerk: IBM 1 Schacht:</tape_alert_message>
<tape_alert_message>Warnung - Beim Lesen oder Schreiben von Daten trat ein schwerwiegender Fehler auf. Dieser Auftrag wurde evtl. nicht erfolgreich abgeschlossen. Wechsler: Laufwerk: IBM 1 Schacht:</tape_alert_message>
<tape_alert_message>Kritisch - Das Medienlaufwerk muss gereinigt werden: 1. Falls der Vorgang angehalten wurde, werfen Sie das Medium aus, und reinigen Sie das Laufwerk. 2. Falls der Vorgang nicht angehalten wurde, warten Sie auf die Fertigstellung, und reinigen Sie danach das Laufwerk. Schlagen Sie im Benutzerhandbuch des Medienlaufwerks nach gerätespezifischen Reinigungsanweisungen nach. Wechsler: Laufwerk: IBM 1 Schacht:</tape_alert_message>
<tape_alert_message>Kritisch - Es besteht die Gefahr von Datenverlust: 1. Kopieren Sie alle benötigten Daten auf einen anderen Datenträger. 2. Verwenden Sie dieses Medium nicht mehr. 3. Wiederholen Sie den Vorgang mit einem anderen Medium. Wechsler: Laufwerk: IBM 1 Schacht:</tape_alert_message>
</tape_alerts>
- <footer>
<filler>======================================================================</filler>
<end_time>Auftrag beendet am Mittwoch, 5. September 2007 um 19:24:40</end_time>
<engine_completion_status>Auftragsabschlussstatus: Fehlgeschlagen</engine_completion_status>
<filler>======================================================================</filler>
<completeStatus>6</completeStatus>
<errorDescription>Endgültiger Fehler: 0xe00084ec - Ein Lese-/Schreibfehler trat auf. Dies ist in der Regel auf schmutzige Lese-/Schreibköpfe im Medienlaufwerk zurückzuführen. Reinigen Sie das Medienlaufwerk und wiederholen Sie den Auftrag. Besteht das Problem anschließend weiterhin, verwenden Sie ein anderes Medium. Möglicherweise kann der Fehler auch durch Probleme mit Kabeln, Terminierung oder anderer Hardware verursacht werden.</errorDescription>
<errorCategory>Endgültige Fehlerkategorie: Sicherungsmedienfehler</errorCategory>
<umiOriginator>79</umiOriginator>
<justErrorCode>-536836884</justErrorCode>
</footer>
</joblog>

Hab die Sache auch schon wiederholt, und mal wieder die das REinigungsband eingelegt
AlithAnar99
AlithAnar99 05.09.2007 um 21:55:50 Uhr
Goto Top
Hallo

Das mit der ID wusste ich nicht, sollte aber eigentlich keine Rolle spielen, da das Tape mit der ID ja schon eine Weile lief. Hab die jetzt aber trotzdem mal auf 3 geändert.

Der Server braucht ca 90 Minuten um die 90 GB aufs BAnd zu schaufeln, also ca mit 1 GB / Minute. Zur Zeit zeigt er aber gerade 3 GB / Minute, scheint aber trotzdem gerade wieder auf den Fehler zu laufen <kotz>

6 Minuten fleissig und schnell geschrieben dann 4 Minuten 0 Byte und jetzt die Fehlermeldung.

Wie gesagt, einen Hardwarefehler schliesse ich eigentlich aus, weil wir wirklich schon alles gewechselt haben.

THomas
AlithAnar99
AlithAnar99 05.09.2007 um 22:00:16 Uhr
Goto Top
Hallo

Im log kann man sehen, das es immer die gleiche Datei ist, weil bei uns die Sicherungsdateien so gross sind. Wenn ich kleine DAteien schreiben lassen tritt das Problem auch nach etwa der gleichen Datenmenge auf.

Es sind immer um die 10 GB. Heute waren es je 1 x 11; 12 und als ausreißer nach unten einmal 6 GB.

Aber dan Backup Exec, hab ich zumindest mal eine Fehlermeldung, mit der in bei google mehr anfangen kann also mit "mein Band schreibt nur 10 GB" ;)

Danke schon mal soweit für die Hilfe.

Thomas
AlithAnar99
AlithAnar99 13.11.2007 um 18:28:42 Uhr
Goto Top
So face-smile

Heute endlich (?) die Lösung.

Nachdem wir die Sache fast 2 Monate recht halbherzig verfolgt haben (Band bei Partner eingeschickt zum testen) auf sich beruhen haben lassen, gab es noch mal ein Tiket.
Jetzt wurden noch einmal alles durchgegangen (logfiles, dumps ziehen etc.) dabei wurde jetzt festgestellt, das das neue Laufwerk das uns geschickt wurde einen Hardwaredefekt hatte.

Also ist heute noch ein neues Laufwerk gekommen und das sichert jetzt luistig vor sich hin, und wird es wohl auch noch ein Weilchen tun <aufholzklopf>

Thomas