20080708z NetS Notfallserver Raiffeisenbank

 Home | News | Hefte | Mediadaten | Online-Artikel | Kommentare | Trends | Wir-ueber-uns | Tipps | Impressum | CeBIT 2012

 

Home
News
Trends
Hefte
Online-Artikel
Kommentare
Service-Angebote
Feedback
Abonnement
Wir-ueber-uns
Tipps
Impressum
Veranstaltungen


»manage it« als

E-Paper  5-6 2011
E-Paper  3-4 2011
E-Paper  1-2 2011
E-Paper  11-12 2010
E-Paper  9-10 2010

E-Paper  7-8 2010
E-Paper  5-6 2010
 




 

 


 




 


 


 

 

 

Notfallserver

Und plötzlich sahen wir rot…

In kaum einer Branche sind IT-Services von so großer Bedeutung wie in der Kreditwirtschaft. Die Raiffeisenbank Sulzbach-Rosenberg e.G. hat daher ihre sieben Server mit dem hochverfügbaren Notfallserver der Firma NetS abgesichert. Die Gründe waren die einfache Installation und dass im Ernstfall auch Laien das System in wenigen Minuten starten können. Am Beispiel eines prekären Hardware-Defektes konnte der Notfallserver seine Qualität über vier Wochen lang beweisen.

 

S

pätestens, wenn am Hardwaregehäuse eine rote Lampe leuchtet, stehen die Zeichen auf Sturm. So auch kürzlich in der Hauptstelle der Raiffeisenbank Sulzbach-Rosenberg e.G., als der Administrator bei der Serverkontrolle feststellte, dass einer der sieben Server – konkret der Mailserver für Lotus Notes – aufgrund eines Hardwaredefekts komplett streikte. »Im Gegensatz zu vielen Fällen, in denen keine jederzeit aktivierbaren Sicherheitslösungen zur Verfügung stehen, brach jedoch bei uns keine unnötige Hektik aus, weil wir schon lange vorgesorgt hatten«, erläutert Günter Späth als Leiter der IT-Gruppe, der von Thilo Winter und Thomas Hollweck unterstützt wird.

 99,5 Prozent Sicherheit ist nicht genug!

Zwar sind »normale« Server, die nicht speziell auf Hochverfügbarkeit ausgelegt sind, zu 99,5 Prozent zuverlässig, was auf den ersten Blick ziemlich gut klingt. Genau betrachtet bedeutet das »Restrisiko« von 0,5 Prozent aber eine mittlere jährliche Ausfallzeit von knapp zwei Tagen. Und das klingt im Kontext von Business Continuity für eine Server-Landschaft einer Bank wiederum ziemlich schlecht. Vor allem, wenn es um Produktiv-Server wie Citrix-Terminalserver, Domaincontroller für das Netzwerk, Printserver für die Kreditbearbeitung und Mail- oder Webserver für das Onlinebanking geht. Hier können längere Ausfälle empfindliche finanzielle und Image-Schäden anrichten.

»Genau eine solche Vision hatten wir vor Augen, als wir uns bereits vor zehn Jahren für die hochverfügbare Absicherung unserer Server-Landschaft entschieden, weil uns die Wartungsverträge der Lieferanten keinen ausreichend schnellen Wiederanlauf garantieren konnten. Unser IBM Tivoli Storage Manager sichert zwar die Daten, bietet aber keinen Ersatz für einen Server«, erläutert Thomas Hollweck, Administrator bei der Raiffeisenbank Sulzbach-Rosenberg.

Einfache Hochverfügbarkeit

Die Wahl fiel – empfohlen und vertrieben durch den IT-Dienstleister der Raiffeisenbanken, die Fiducia IT AG – auf den Hardware- und Applikations-unabhängigen Notfallserver der NetS GmbH. Dieses einfache und doch intelligente Sicherheitskonzept wurde von dem oberpfälzischen IT-Software-Anbieter in Rieden bei Amberg entwickelt und gewährleistet die Überbrückung von Systemausfällen und die anschließende Wiederherstellung und Inbetriebnahme eines ausgefallenen Servers ohne Ausfallzeiten und Datenverlust.

»Damals hatte der Notfallserver die sieben Systeme unter OS/2 abgesichert. Seit 2005 läuft die gesamte Infrastruktur auf Windows-Basis, wobei zur Hauptstelle noch eine Zweigstelle hinzu kam, so dass insgesamt zwei Notfallserver mit je einer Enterprise-Lizenz angeschafft wurden«, sagt Roland Schaad, Geschäftsführer der NetS GmbH. Auch die neuen Versionen der Notfallserver und Primärsystemagenten wurden mit Windows-Installationspaketen jeweils in nur etwa einer halben Stunde eingerichtet. Diese Installation und die nachfolgenden regelmäßigen Updates konnten im Produktivbetrieb erfolgen, da kein Systemboot erforderlich war.

Um an beiden Standorten jeden der sieben Produktivserver vom Typ Fujitsu Siemens TX abzusichern, replizierte Thomas Hollweck nach der Installation jedes Produktivsystem auf den jeweiligen Notfallserver. Dabei wurde von jedem Produktivsystem ein Abbild in dessen Imagepool erzeugt. »Sehr praktisch ist, dass wir die Funktionalität auch sofort kontrollieren konnten. Die Lösung bietet nämlich die Möglichkeit, jedes Image eines gesicherten Produktivsystems sofort nach dessen Replikation zu starten und damit den erfolgreichen Sicherungsvorgang zu verifizieren«, sagt Hollweck.

Aufgrund der Datenmenge von insgesamt 550 GB für alle sieben Server dauerten die Spiegelungsvorgänge, die automatisch quasi im Hintergrund abliefen, knapp einen Arbeitstag. Anschließend war die Sicherheitslösung jederzeit auf Knopfdruck startbereit und konnte jeden Server beliebig lange ersetzen.

 

In zehn Minuten wieder »auf Draht«

Während des geschilderten Mailserver-Notfalls in der Hauptstelle ergab die erste Diagnose, dass bei dem schadhaften Server das Motherboard und der komplette Hauptspeicher ausgetauscht werden mussten. Da dies während des laufenden Betriebs durchzuführen war, schlug – wie schon häufiger zuvor bei kleineren Ausfällen – wieder die Stunde des Notfallservers. »Aufgrund der einfachen Administration kann im Prinzip jeder das System hochfahren. Die Daten auf dem Notfallserver sind immer aktuell, weil nach der ersten Replikation regelmäßig Aktualisierungen erfolgen. Das geht quasi unbemerkt und sehr schnell, da alle weiteren Kopiervorgänge inkrementell auf 64k-Blockebene erfolgen, also nur die veränderten Daten gesichert werden. Nach dem Start erscheint eine einfach gestaltete Benutzeroberfläche mit allen abgesicherten Produktivservern, auf der per Mausklick der gewünschte Server aktiviert wird und dann systemabhängig innerhalb von drei bis zehn Minuten voll funktionsfähig ist. Im konkreten Fall dauerte der Vorgang für den Mailserver rund fünf Minuten, dann waren wir wieder erreichbar«, erklärt Hollweck das Konzept.

Der Teufel im Detail

Nach dem Austausch des defekten Motherboards durch die Fiducia-Tochter TSG GmbH konnte der alte Server allerdings nicht mehr in Betrieb genommen werden, da das RAID-System die Festplatten nicht mehr richtig zuordnen konnte. Also war ein erneuter Technikereinsatz nötig, bei dem ein Defekt am RAID-Controller festgestellt wurde. Nach dessen Ersatz konnte die RAID-Konfiguration erfolgreich durchgeführt werden. Allerdings ergaben sich Probleme bei der anschließenden Rücksicherung der Daten vom Notfallserver auf die bestehende Hardware, weil die Partitionierung der Platten nicht funktionierte. Das lag nach Aussage des Fiducia-Rechenzentrums an einer falschen Version des RAID-Controllers, der daraufhin auf die freigegebene Version downgegradet wurde. Danach scheiterte die Rücksicherung an der RAID-Konfiguration erneut mehrmals, so dass Thomas Hollweck und der TSG-Techniker beschlossen, einen Ersatzserver zu beschaffen. Mittlerweile war der Notfallserver bereits drei Wochen im Produktivbetrieb gelaufen.

Ein Pech kommt selten allein: Der Ersatz-Server erlitt auf dem Transport einen Totalschaden, so dass eine weitere Woche verging, bevor endlich ein einwandfreies neues System zur Verfügung stand.

Wiederanlauf auf neuem Rechner

Da zur Wiederherstellung nun eine neue Hardware zum Einsatz kam, war wie bei jeder Migration zunächst eine Grundinstallation mit einer dem Produktivsystem identischen Windows-Version erforderlich. Diese diente aber lediglich zur Bereitstellung der Hardwarekonfiguration sowie zugehöriger Treiber und wurde im Zuge des Wiederherstellungsprozesses mit den laufenden Daten des Notfallservers überschrieben.

Die Wiederherstellung selbst entsprach im Grunde der umgekehrten Replikation, die nun vom als Mailsystem laufenden Notfallserver auf den neuen Rechner durchgeführt wurde. Noch während der Notfallserver uneingeschränkt als Produktivsystem lief, führte der Administrator von diesem eine Spiegelung auf die neue Hardware durch. Die während der automatisch ablaufenden Replikation neu hinzugekommenen Daten wurden am Schluss nochmals inkrementell auf das nun aktuelle Produktivsystem repliziert. Anschließend konnte der Notfallserver wieder in seinen ursprünglichen »Standby-Betrieb« geschaltet und der »neu betankte« Rechner als Primärsystem gestartet werden. »Diesen Prozess konnten wir leicht einplanen und außerhalb des Produktionsbetriebs durchführen«, erläutert Hollweck.

Notfälle ohne Not

In diesem bisher längsten Ausfall der Raiffeisenbank Sulzbach-Rosenberg ersetzte der Notfall-Server den Mailserver insgesamt vier Wochen lang komplett. Aufgrund des Konzepts und der an die Infrastruktur angepassten Hardware war der Produktivbetrieb während der ganzen Zeit ohne Performance-Verlust möglich.

»Bei einem IT-Ausfall rechnet man mit einem Schaden von etwa einem Euro pro Minute und Mitarbeiter. Da wir die Lösung schon öfter aktivieren mussten, hat sich die Anschaffung für den Notfallserver von etwa 5.000 Euro sehr gelohnt. Derzeit sind wir mit der Ausstattung gut versorgt, bei Mehrbedarf werden wir die Infrastruktur entsprechend ausbauen«, erklärt Hollweck abschließend.

Doris Jessen

_____________________________________________________________________

Doris Jessen, Fachjournalistin in Hamburg

 

Background Technik

Abgesicherte Produktiv-Systeme (alle Fujitsu Siemens TX-Series)

Ø Mailserver

Ø Webserver

Ø Domain Controller

Ø Printserver

Ø Fileserver

Ø 2 Citrix Terminal-Server

Ø Insgesamt 550 GB Datenvolumen

Ø 100 MBit Ethernet-LAN

Genutzte Notfallserver-Hardware

Je ein Fujitsu Siemens TX in der Haupt- und Zweigstelle

2 Notfallserver Enterprise Lizenzen

 

 

 

Roland Schaad, Geschäftsführer der NetS GmbH und Entwickler des Notfallservers

 

 

Thomas Hollweck, Administrator der Raiffeisenbank Sulzbach-Rosenberg

 

 

Folgen Sie »manage it«

auf Google+


 


 


 

 

 
Copyright © 2003-2012  ap Verlag GmbH