EMC Avamar Deduplikation

 Home | News | Hefte | Mediadaten | Online-Artikel | Kommentare | Trends | Wir-ueber-uns | Tipps | Impressum | CeBIT 2012

 

Home
News
Trends
Hefte
Online-Artikel
Kommentare
Service-Angebote
Feedback
Abonnement
Wir-ueber-uns
Tipps
Impressum
Veranstaltungen


»manage it« als

E-Paper  5-6 2011
E-Paper  3-4 2011
E-Paper  1-2 2011
E-Paper  11-12 2010
E-Paper  9-10 2010

E-Paper  7-8 2010
E-Paper  5-6 2010
 




 

 


 




 


 


 

 

 

Deduplikation

Engpässe vermeiden

Seit knapp zwei Jahren steht die Deduplikation ganz oben auf der Liste der »heißen« Themen, die Storage-Experten und Administratoren in den Unternehmen gleichermaßen umtreiben. Nachdem der Trend zunächst das IT-Mutterland USA erfasste, interessieren sich inzwischen auch immer mehr heimische Anwender für die noch relativ neue Methode der Datenreduktion, von der sie sich vor allem umfangreiche Zeitgewinne bei Backup und Recovery versprechen.

 

K

lassische Unternehmensanwendungen, etwa ERP-Systeme, Groupware und Datenbanken, produzieren ebenso wie die in dieser Hinsicht zu Recht gefürchteten Web-2.0- beziehungsweise Multimedia-Applikationen täglich eine nach Zehn- bis Hunderttausenden zählende Menge von Dateien, die gespeichert, gesichert und für die Notfallvorsorge repliziert werden müssen. Dass damit der Speicherbedarf exponentiell wächst und die Kosten für Storage-Systeme wie für typische Operationen – namentlich Backup und Recovery – ebenfalls sprunghaft steigen, lässt sich leicht denken. Die Situation wird noch dadurch verschärft, dass rechtliche Vorgaben wie etwa die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU) die Anwender zwingen, mehr Informationen als bisher »in Reichweite« zu halten, so dass Steuer- und gegebenenfalls Strafverfolgungsbehörden ohne Zeitverlust darauf zurückgreifen können. Um den Aufwand in vertretbaren Grenzen zu halten, reichen herkömmliche Verfahren der Datenreduktion nur noch in den wenigsten Fällen aus.

Von daher war es nur logisch, dass sich vor einigen Jahren zunächst eine Reihe von Spezialisten auf die Suche nach effizienteren Methoden machte. Zu diesem Zweck nahmen sie im ersten Schritt typische Informationsbestände von Unternehmen unter die Lupe – und förderten in der Tat Erstaunliches zu Tage. Denn: In einer durchschnittlichen verteilten Umgebung setzen sich die vorgehaltenen, regelmäßig hin und her bewegten Datensätze zu 60 bis über 90 Prozent aus bekannten, miteinander identischen Elementen zusammen. Das hier schlummernde Einsparpotenzial erschließt sich sogar Laien auf den ersten Blick. Folgerichtig gingen die erwähnten Spezialisten – unter ihnen Firmen wie Rocksoft (heute Quantum) und Falcon Stor – daran, Algorithmen zu entwickeln, die derartige Dubletten zuverlässig aufspüren und aussortieren beziehungsweise nach Möglichkeit gar nicht erst entstehen lassen. Das war die Geburtsstunde der sogenannten Deduplikationslösungen.

Datenbestand bereinigen

Zu den Wegbereitern der neuen Technik gehörte auch Avamar Corporate, das für seine Axion getaufte Paketlösung 2006 die Auszeichnung »Produkt des Jahres« des renommierten Fachmagazins Storage erhielt. »Paketlösung« bedeutet in diesem Zusammenhang, dass die eigentliche Deduplikationssoftware auf einem dedizierten Server installiert wird, der als zentraler Backup-Speicher dient. Auf allen anderen Servern im Unternehmen laufen sogenannte Agenten, welche die dort anfallenden Daten analysieren und aus diesen mit Hilfe eines Hash-Algorithmus zunächst einen 20 Byte langen Fingerabdruck erstellen, den sie an den zentralen Speicher übermitteln. Bei einer erstmals zu sichernden Datei existieren solche Fingerabdrücke natürlich noch nicht, deswegen zerlegt der Agent die Informationen in variabel große Blöcke und vergleicht die zugehörigen Hash-Codes mit bereits lokal gespeicherten. Nicht vorhandene Hashes – und damit Datenblöcke, die von diesem Client noch nie gesichert wurden – werden zur Abfrage an den Server geschickt. Dieser vergleicht in einer globalen Datenbank, ob Hash-Codes bereits vorhanden sind, und weist den Agenten an, alle zugehörigen Datenblöcke zu schicken, die noch nie am Server angelegt wurden.

Der zentrale Server bildet mit ID-Pointer alle Dateien und Filesysteme der Clients ab, die bei weiteren Zugriffen auf das »Originaldokument« verweisen. Das Ergebnis verursacht deutlich weniger Aufwand als die Sicherung der kompletten Datei.

An der Quelle

Vom Funktionsprinzip her unterschied sich Avamars Lösung damit kaum von vergleichbaren Angeboten – wohl aber im Hinblick auf den Zeitpunkt, zu dem die Reduktion beziehungsweise Bereinigung der Daten erfolgt. Da diese vor der eigentlichen Speicherung stattfindet, spricht man hier auch von einer Deduplikation an der Datenquelle (engl. source de-dupe). Gegenüber nachgelagerten Verfahren hat dies den Vorteil, dass das Datenaufkommen bereits im Verlauf eines Backups drastisch reduziert wird, was wiederum das Netzwerk entlastet, so dass sowohl inkrementelle als auch vollständige Sicherungsvorgänge selbst bei geringer Bandbreite in wenigen Stunden abzuwickeln sind. Damit eignete sich die Avamar-Lösung besonders für Unternehmen, die viele Niederlassungen und Zweigstellen in ihre täglichen, wöchentlichen und monatlichen Datensicherungen einbinden müssen.

Das leuchtete auch EMC ein, weshalb der Speichermarktführer das Start-up samt Produktportfolio und Mitarbeiterstab für 165 Millionen Dollar aufkaufte und in eine Tochtergesellschaft umwandelte. Damit einher ging eine Umbenennung: Aus Axion wurde der Avamar Server, den EMC hier zu Lande außer über die eigenen Partner hauptsächlich über das Händlernetz von Fujitsu Siemens Computers vertreibt. »Mit EMC arbeiten wir im Storage-Segment bereits seit gut einem Jahrzehnt erfolgreich zusammen«, bemerkt dazu Detlef Lieb, Senior Product and Program Marketing Manager bei Fujitsu Siemens Computers in Bad Homburg. Mit Blick auf die Deduplikation ist die erste Frucht dieser Kooperation die Produktlinie Avamar on Primergy, die zum Herbst 2007 auf den Markt kam. Die zentrale Instanz bildet dabei ein Primergy-Industriestandardserver der Baureihen RX 300 oder TX 300, der je nach Einsatzszenario und Budget mit maximal zwei Dual- beziehungsweise Quad-Core-Prozessoren (Intel Xeon beziehungsweise AMD Opteron) bestückt ist und auf dem die Dedupe-Software läuft. Der Speicher besteht wahlweise aus je sechs 500-GB-SATA- beziehungsweise 300-GB-SAS-Festplatten, die als RAID 5 konfiguriert sind, was parallele Lese- und Schreibzugriffe über das ganze Array hinweg erlaubt. Kontakt zum LAN nehmen die Maschinen über Gigabit Ethernet bzw. iSCSI auf, was für eine besonders einfache Anbindung sorgt.

Anspruchsvolle Szenarien

»Einsatzfelder finden sich zurzeit vor allem bei Finanzdienstleistern und im Retail-Bereich«, erklärt dazu Bernhard Mayr-Menz, der als Principal System Engineer bei EMC für die Vertriebsunterstützung von Avamar on Primergy verantwortlich ist. »So muss einer unserer größten Kunden beispielsweise ein Netz von aktuell über 500 Außenstellen einbinden, das ständig weiter wächst. « Probleme bereitete hier weniger das Datenaufkommen an sich, das mit einigen Hundert MB bis einigen Dutzend GB pro Filiale und Tag typischen Anforderungen entsprach. Dafür aber war die Infrastruktur historisch gewachsen, was bedeutet, dass bei der Datensicherung bisher verschiedene Hard- und Softwarelösungen zum Einsatz kamen. Darüber hinaus standen für die Datenübertragung zur Zentrale lediglich normale ISDN-Verbindungen mit einer Bandbreite von 128 kbit/s zur Verfügung. Ein tägliches zentrales Backup war somit praktisch nicht beziehungsweise nicht mit wirtschaftlich vertretbarem Aufwand realisierbar. »Mit der Einführung von Avamar on Primergy haben wir jedoch genau dies ermöglicht«, erläutert Mayr-Menz weiter. »In den Außenstellen läuft jetzt nur noch je ein Agent, der das Datenaufkommen wie beschrieben bereits an der Quelle reduziert und nur noch die unbedingt erforderlichen Informationen an den Avamar Server in der Zentrale überträgt.« So war nicht einmal ein Wechsel der Verbindungstechnik vonnöten.

Ein weiterer Vorteil besteht in der engen Integration von Avamar mit EMCs Backup- und Recovery-Suite Networker. Auch hier kann Mayr-Menz auf ein Projekt verweisen, »das wir derzeit zusammen mit Fujitsu Siemens Computers realisieren und das sich im Proof-of-Concept-Stadium befindet. « In diesem Fall handelt es sich um einen global agierenden Anwender, der Niederlassungen in den USA und Japan unterhält. »Dieser Kunde nutzte Networker bereits zur zentralen Datensicherung und war damit durchaus zufrieden.« Die Avamar-Einführung verspricht indes auch hier einen spürbaren Effizienzgewinn, ohne dass dafür bei einer Standalone-Lösung unvermeidbare Umstellungsaufwand erforderlich wäre: »Grob vereinfacht ausgedrückt muss hier nur die vorhandene Deduplizierungsoption aktiviert werden, und Avamar versieht seinen Dienst – ohne dass die Mitarbeiter umlernen beziehungsweise sich auf eine neue Benutzeroberfläche einstellen müssten«, so Mayr-Menz.

Resümee

Mit Avamar on Primergy verfügen EMC und Fujitsu Siemens Computers über eine attraktive Deduplizierungslösung, die speziell Anwendern mit weit verzweigten IT-Landschaften dabei helfen kann, zentrale Backup- und Recovery-Prozesse zu realisieren beziehungsweise deutlich effizienter als bisher abzuwickeln. »Das gilt außer für reale auch für virtualisierte Server-Umgebungen, weswegen sich zuletzt Anfragen von Vmware-Nutzern mehrten«, ergänzt Mayr-Menz. Die für eine Basisinstallation anfallenden Einführungskosten in fünfstelliger Höhe amortisieren sich in der Regel sehr schnell, zum einen durch die Zeitersparnis und zum anderen, weil bisheriges Equipment einschließlich Software-Lösungen weitergenutzt werden kann, wodurch sich der Einarbeitungsaufwand in akzeptablen Grenzen hält.

Wolfgang Dumke

_____________________________________________________________________

Wolfgang Dumke ist freier Journalist in Griesheim bei Darmstadt

 

 

 

Folgen Sie »manage it«

auf Google+


 


 


 

 

 
Copyright © 2003-2012  ap Verlag GmbH