Home
News
Trends
Hefte
Online-Artikel
Kommentare
Service-Angebote
Feedback
Abonnement
Wir-ueber-uns
Tipps
Impressum
Veranstaltungen


»manage it« als

E-Paper  5-6 2011
E-Paper  3-4 2011
E-Paper  1-2 2011
E-Paper  11-12 2010
E-Paper  9-10 2010

E-Paper  7-8 2010
E-Paper  5-6 2010
 




 

 


 




 


 


 

 

 

Fehlertolerante Server bei der Thyssen Krupp Steel AG

Hochverfügbarkeit aus einem Guss

Für die Steuerung der Stahlherstellung verwendet die Thyssen Krupp Steel AG eine selbst entwickelte Software auf Windows-Servern. Da die Prozesse in hohem Maße betriebskritisch sind, müssen besondere Vorkehrungen zur Sicherstellung der Verfügbarkeit der Server getroffen werden. Seit das Unternehmen fehlertolerante Server von Stratus einsetzt, hatte es noch keinen einzigen Hardware-Ausfall zu verzeichnen.

 

S

eit über einem Jahrzehnt war in Deutschland kein Hochofen mehr in Betrieb genommen worden, als am 13. Dezember 2007 in Duisburg-Bruckhausen der neue Hochofen 8 der Thyssen Krupp Stahl AG angeblasen wurde. Mit modernster Technik werden in diesem 92 Meter hohen und 250 Millionen Euro teuren Koloss täglich rund 5.600 Tonnen  Roheisen produziert. Stahl ist gefragt wie selten zuvor, die gute Konjunktur in den Schwellenländern sorgt für eine rege Nachfrage. Tatsächlich funktioniert nichts ohne Stahl, gleich ob Autos, Schiffe, Brücken, Hochhäuser oder Waschmaschinen gebaut werden. Auch Duisburg, neben Schanghai weltweit der wichtigste Stahlstandort, hat seinen Anteil am Stahlboom: Pro Jahr werden hier von der Thyssen Krupp Stahl AG in aufwendigen Verfahren rund 15 Millionen Tonnen hochwertiger Stahl produziert.

 »Stahlwerke sind Unikate«, erklärt Jürgen Schikowski, Teamleiter Oxygenstahlwerke bei der Thyssen Krupp Steel AG. »Die für den Betrieb erforderliche Anlagentechnik kann man nicht fertig von der Stange kaufen.« Dementsprechend ist auch die IT, die die Anlagen der beiden Duisburger Stahlwerke der Thyssen Krupp Steel AG steuert, eine Spezialanfertigung. Sie wird von Thyssen Krupp in eigener Regie betrieben und verwendet für die Kernaufgaben selbst entwickelte Software. Die IT ist heute in drei logische Schichten aufgebaut:

·         Schicht 1 umfasst die Steuerung und Regelung der technischen Aggregate, wie Roheisenentschwefelung, Konverter, Vakuumanlagen usw.

·         Schicht 2 verbindet die Aggregate der Schicht 1 anhand metallurgischer Modellkonzepte zu einem Prozess.

·         Schicht 3 wird von kaufmännischen Systemen gebildet, die beispielsweise die einzelnen Aufträge der Stahlherstellung verwalten.

Während die Systeme der Schicht 1 von der Technik der jeweiligen Aggregate vorgegeben sind und für die Schicht 3 hauptsächlich Standard-Lösungen wie SAP eingesetzt werden können, bildet die Schicht 2 die Arbeitsabläufe der Stahlherstellung ab. Diese Software musste von Thyssen Krupp vollständig selbst entwickelt werden. »In diesen Applikationen ist umfangreiches metallurgisches Prozess-Know-how enthalten, das außerhalb von Stahlwerken nicht vorhanden ist«, erläutert Schikowski. Die IT-Systeme der Schicht 1 sind in sich abgeschlossen und ändern sich mit ihren Aggregaten, die der Schicht 2 müssen dagegen sehr flexibel aufgebaut sein. Werden an irgendeiner Stelle bei den metallurgischen Verfahren und in den Arbeitsprozessen technische Änderungen vorgenommen, müssen diese sofort auch in der Prozesssoftware abgebildet werden, andernfalls könnten die Neuerungen gar nicht in Betrieb genommen werden.

Verfügbarkeit für kontinuierliche Prozesse

Die dafür eingesetzten IT-Systeme entstanden ursprünglich aus den klassischen Prozessrechnern der frühen 70er Jahre, die in den 80er Jahren auf wissenschaftlich fundierte Modelle umgestellt wurden. Bis in die Mitte der 90er Jahre wurde diese Lösung auf Siemens R30/M70-Rech­nern betrieben, dann wechselte der Stahlwerksbereich zu flexibleren, leistungsfähigeren Systemen auf Basis von Windows-Serversoftware. Um die Prozess-Software für das neue Betriebssystem nicht komplett neu schreiben zu müssen – was angesichts des Umfangs der Applikationen eine Projektlaufzeit von etwa drei Jahren erfordert hätte –, griff man auf einen Emulator zurück, der seither unter Windows die R30/M70-Umgebung 1:1 nachbildet. Durch diese Emulations-Lösung hat sich die Thyssen Krupp-IT ein Zeitfenster verschafft, in dem sie die Anwendungen Aggregat für Aggregat auf Windows .net portieren kann.

 Da diese Prozessapplikationen den gesamten Arbeitsablauf in den beiden Duisburger Stahlwerken steuern, hängt von ihrer Verfügbarkeit der gesamte Betrieb ab. »Wir haben hier Prozesse, die Chargen-orientiert ablaufen, und Unterbrechungen können 350 Tonnen Stahl unbrauchbar machen.« Zumal die einzelnen Prozesse aus Gründen der Qualitätssicherung laufend überwacht und dokumentiert werden. Die Thyssen Krupp Steel AG hat daher ganz besonders hohe Anforderungen an die Verfügbarkeit ihrer IT-Systeme.

Anfangs stellte das Unternehmen die Verfügbarkeit der IT-Systeme der Schicht 2 im Cold-Stand-by-Verfahren sicher. Dabei wurden neben den produktiven Servern weitere in Reserve gehalten, die bei Betriebsunterbrechungen durch den IT-Support manuell hochgefahren werden konnten. Abgesehen vom hohen Aufwand durch die ständige Bereitschaft von Personal, konnten die Unterbrechungen bei diesem Verfahren aber durchaus bis zu zehn Minuten, in Extremfällen sogar bis zu einer Stunde, betragen. Diese Situation war nicht nur IT-technisch unbefriedigend, unter anderem weil es immer sehr aufwendig war, die häufigen Release-Wech­sel der Software auf allen Systemen synchron zu halten. Die Cold-Stand-by-Lösung entsprach schließlich auch nicht mehr den wachsenden Anforderungen der Stahlherstellung an die IT, zumal heute weit höhere Anforderungen an die Qualitätssicherung gestellt sind als in den 70er Jahren und unterbrechungsfreie Prozesse voraussetzt. »Der Schaden eines Serverausfalls wäre kaum quantifizierbar«, stellt Schikowski fest. »Wir haben die daraus entstehenden Kosten daher gar nicht mehr kalkuliert, sondern uns stattdessen um eine ausfallsichere Lösung gekümmert.«

Fehlertoleranz statt Cluster

Obwohl im Unternehmen bereits entsprechendes Know-how vorhanden gewesen wäre, entschied man sich gegen den Einsatz eines Cluster-Systems, denn diese Lösung hätte einen hohen Administrationsaufwand bedingt und es wäre dafür eine umfangreiche Anpassung der Applikationen erforderlich gewesen. Die Thyssen Krupp Steel AG setzt daher für die Systeme der Schicht 2 die fehlertoleranten Server von Stratus ein. Diese Systeme verwenden für alle betriebswichtigen Bereiche, also CPU, IO-Ein­heit oder Festplatten, redundante Komponenten und können so auch bei Hardware-Störungen ohne jegliche Unterbrechung weiterarbeiten. Auf diese Weise erreichen die ftServer (fehlertolerante Server) eine kontinuierliche Verfügbarkeit von mindestens 99,999 Prozent, was im Dauerbetrieb einer Ausfallzeit von weniger als 5 Minuten pro Jahr entspricht. Stratus-Server übertreffen damit Cluster-Lö­sungen und verhalten sich gegenüber dem Betriebssystem wie ein einziger Rechner, benötigen also im Unterschied zu Cluster-Lösungen auch keine speziell angepasste Software.

Seit 2003 hat Thyssen Krupp in seinen beiden Duisburger Stahlwerken die IT in der betriebskritischen Schicht 2 mit Stratus-Servern abgesichert. In beiden Werken sind neben den produktiven ftServern noch weitere Stratus-Server für die Betriebsdatenbank sowie für Entwicklung und Test im Einsatz. Die Entwicklungs-Server fungieren auch noch als Stand-by-Sys­teme und können notfalls selbst in den produktiven Betrieb genommen werden. Die fehlertoleranten Server sind also über die 99,999-prozentige Hochverfügbarkeit hinaus auch noch durch Systeme abgesichert, die ihrerseits hochverfügbar sind. »Damit sind wir weit über das Erforderliche hinaus gegangen«, stellt Schikowski fest. »Aber wir können dem Unternehmen auf dieser Basis guten Gewissens für die Prozesssteuerung eine kontinuierliche Verfügbarkeit rund um die Uhr garantieren.«

 Insgesamt betreibt die Thyssen Krupp Steel AG die Stratus ftServer also in drei Doppelsystemen – für jedes der beiden Stahlwerke je ein produktives, ein Entwicklungs- und ein Datenbanksystem –, die alle vom Solinger Stratus-Partner Nonstop Technologies betreut werden. »Wir wollten kein eigenes Know-how für fehlertolerante Server aufbauen«, merkt Schikowski an. »Schließlich sind dafür keine besonderen Kenntnisse aus dem Bereich der Stahlerzeugung nötig – darauf wollen wir uns konzentrieren.«

Der Ausfall einzelner Komponenten, etwa einer Festplatte, wird durch die »Call home«-Technologie automatisch an das Stratus Customer Assistance Center gemeldet, von wo gegebenenfalls Austauschkomponenten direkt zum Anwender beziehungsweise zum Stratus-Partner geschickt werden. Oft erfährt der Anwender von einer solchen Störung erst dann etwas, wenn das Austauschteil bereits installiert wird. Da diese Komponenten im laufenden Betrieb ausgetauscht werden können, ist auch dafür keine Betriebsunterbrechung notwendig. So kam es in fast fünf Jahren Dauerbetrieb zu keiner einzigen Unterbrechung im Betrieb der Stratus-Server – weder geplant, noch ungeplant. »Das ist die Hochverfügbarkeit, die wir brauchen«, resümiert Schikowski.

Dr. Rainer Doh

____________________________________

Dr. Rainer Doh ist Redakteur bei der Beratungsgesellschaft für strategische Kommunikation PR-COM in München
 

Thyssen Krupp

Mit einem Umsatz von 51,7 Milliarden und über 190.000 Mitarbeitern in über 70 Ländern gehört Thyssen Krupp zu den großen Industrie- und Technologiekonzernen weltweit. Die Schwerpunkte bilden Stahl, Industriegüter und Dienstleistungen mit den fünf Segmenten Steel, Stainless, Technologies, Elevator und Services. Das Segment Steel konzentriert sich auf Herstellung und Vertrieb hochwertiger Flachprodukte aus Qualitätsstahl sowie die Erbringung von produktbezogenen Dienstleistungen.

In den beiden Stahlwerken der Thyssen Krupp Stahl AG, die sich in Duisburg über insgesamt fünf Stadtteile erstrecken, werden alle Stufen der Stahlherstellung betrieben: Hochofen, Stahlwerk, Warmband- und Kaltwalzwerk sowie Veredelung. Pro Jahr werden hier etwa 15 Millionen Tonnen Stahl produziert. Rund 30.000 Mitarbeiter der Thyssen Krupp Stahl AG sind in Duisburg beschäftigt; das Unternehmen ist damit einer der größten Arbeitgeber im Ruhrgebiet.

Weitere Informationen zum Unternehmen unter: http://www.Thyssen Krupp-steel.com/de

 

Nonstop Technologies      

Die Nonstop Technologies ist ein Systemhaus, das sich auf hochverfügbare IT-Systeme spezialisiert hat. Mit den fehlertoleranten Servern von Stratus kann Nonstop Technologies seinen Kunden Lösungen mit einer End-to-End-Verfügbarkeiten von mehr als 99,999 Prozent anbieten. Nonstop Technologies ist Stratus ftServer Reseller und Service Provider. Das 2005 gegründete Unternehmen hat seinen Sitz in Solingen.


 

 

Stratus-Technologie

Stratus baut fehlertolerante Server, die auf Basis von Standard-Techno­logie arbeiten, also mit Intel-Prozessoren und mit gängigem Windows-, Linux- oder VMware- Betriebssystem. Bei einem fehlertoleranten Server sind alle Hardwarekomponenten doppelt vorhanden. Fällt eine Komponente aus, wird der Betrieb automatisch und vom Benutzer unbemerkt durch die redundante Komponente weitergeführt. Auf diese Weise können fehlertolerante Systeme bei Störungen ohne Datenverlust kontinuierlich weiterlaufen. Damit unterscheiden sich fehlertolerante Systeme von softwarebasiertem Failover-Clustering, bei dem ein Ausfall der Hard- oder Software dazu führt, dass der Workload auf einen redundanten Server verlagert wird. Fehlererkennung und anschließendes Umschalten zum neuen System können mehr oder weniger lange Ausfallzeiten verursachen. Fehlertolerante Server reduzieren nicht die Folgen von Ausfällen, sondern verhindern Ausfälle komplett.

Stratus erreicht Fehlertoleranz durch die Anwendung einer Reihe innovativer Technologien:

* Lockstep-Technologie

  Replizierte, fehlertolerante Hardwarekomponenten verarbeiten dieselben Befehle in derselben Zeit. Weist eine der Komponenten eine Fehlfunktion auf, übernimmt die entsprechende Partnerkomponente den aktiven Teil ohne Unterbrechung des normalen Betriebs. Probleme wie Systemausfallzeiten und Datenverlust werden eliminiert.

* Ausfallsichere Software

  Durch die Kombination ausfallsicherer Software und Lock­step-Technologie lassen sich viele Softwarefehler und damit verbundene Systemausfälle vermeiden. Systemstörungen werden lokalisiert, analysiert und an Stratus gemeldet. Dies erlaubt den Support-Mitar­beitern, Softwareprobleme proaktiv zu korrigieren, bevor diese erneut auftreten können. Selbst speicherinterne Daten werden konstant geschützt und verwaltet. Die im »Hardening-Verfahren« von Stratus optimierten Gerätetreiber von Stratus ermöglichen eine weitere Erhöhung der Zuverlässigkeit von Windows-Umgebungen auf ftServer-Systemen.

* ActiveService-Architektur

  Stratus ftServer-Systeme überwachen permanent ihren eigenen Betrieb. Stratus-Servicetechniker sind per Remote-Support in der Lage, in über 95 Prozent aller Fälle die Fehler zu diagnostizieren und zu lokalisieren sowie die Probleme zu beheben. Bei Bedarf gibt das System automatisch eine Bestellung für systemkritische Austauschteile aus, welche im laufenden Betrieb ausgetauscht werden können.

 

Folgen Sie »manage it«

auf Google+


 


 


 

 

 
Copyright © 2003-2012  ap Verlag GmbH