20070708zj EMC Avamar FSC Deduplikation

 Home | News | Hefte | Mediadaten | Online-Artikel | Kommentare | Trends | Wir-ueber-uns | Tipps | Impressum | CeBIT 2012

 

Home
News
Trends
Hefte
Online-Artikel
Kommentare
Service-Angebote
Feedback
Abonnement
Wir-ueber-uns
Tipps
Impressum
Veranstaltungen


»manage it« als

E-Paper  5-6 2011
E-Paper  3-4 2011
E-Paper  1-2 2011
E-Paper  11-12 2010
E-Paper  9-10 2010

E-Paper  7-8 2010
E-Paper  5-6 2010
 




 

 


 




 


 


 

 

 

EMC mit Avamar-Deduplikation auf FSC-Servern

Mit Intelligenz Speicherplatz sparen und Bandbreite optimal nutzen

Man braucht keine Marktforschung, um festzustellen, dass das Datenaufkommen in kleinen und mittleren Unternehmen nicht nur steigt, sondern geradezu explodiert. Mit seiner Avamar-Serverlösung bietet EMC einen Ansatz, durch intelligente Speicherung der Daten den vorhandenen Platz auf den Speichergeräten optimal zu nutzen. Das Zauberwort heißt: Deduplikation.

 

S

torage-Marktführer EMC übernahm im November 2006 die Firma Avamar und bietet deren Speziallösung für optimale Speicherung in seinem Portfolio an. Die Software wird auf einem dedizierten Gerät installiert, welches über das Netzwerk mit Applikations- und Datenbank-Servern verbunden ist. Dabei erhält jedes System einen  Agenten zugeteilt, der dafür sorgt, dass der Avamar-Server nur mit den richtigen Daten beliefert wird.

Redundanz beseitigen

Analysiert man Daten, die gespeichert werden, fällt auf, dass vieles immer gleich ist. Bestimmte Informationen sind identisch, sei es beispielsweise auf Dateiebene der Header oder in einer Grafik das immer gleiche Bitmuster einer einfarbigen Fläche. So speichern Anwender viele Daten doppelt, dreifach, mehrfach – man spricht hier von »Redundanz«.

Dieses Schema macht sich die Deduplikation zunutze: Der Agent analysiert die Daten auf dem DB- oder Applikationsserver und erzeugt daraus mittels eines Hash-Algorithmus einen »Fingerabdruck«. Statt der kompletten Daten übermittelt er zunächst nur diesen Fingerabdruck an den Avamar-Server. Existiert der Fingerabdruck noch nicht (etwa bei der erstmaligen Speicherung einer Datei), gibt der Avamar-Server grünes Licht, und die Daten werden zerlegt, übermittelt und gespeichert. Der Hash-Code wandert in eine Metadatenbank. Ist ein Datenblock der gleichen Art dort bereits zu finden und somit auf dem Avamar-Server vorhanden, werden nur die Änderungen gespeichert.

Dadurch speichert der Avamar-Server identische Daten nur einmal. Das hat gleich mehrere Vorteile: Hauptsächlich spart man dadurch Storage-Kapazitäten, denn statt der mehrmals gleichen Datenblöcke werden nur unterschiedliche abgelegt. Je nach Art der Daten kann der Bedarf auf weniger als ein Prozent des ursprünglich benötigten Speicherplatzes sinken. Zudem verringert Deduplikation die I/O-Belastung auf den Datenleitungen zwischen den angeschlossenen Systemen und dem Avamar-Server erheblich, da hauptsächlich Fingerabdruckdateien geschickt werden. Das wiederum verkürzt die Zugriffszeiten im Gesamtsystem – Deduplikation bringt also einen Performance-Gewinn.

Variable Blockgrößen

Zur Optimierung trägt ferner bei, dass die Agenten die Daten intelligent analysieren und die Blockgröße an deren Art anpassen – sie liegt zwischen einem Byte und bis zu 64 KByte. Verschwindend gering ist dagegen der Fingerabdruck – nur 20 Byte benötigt das System, um alle wichtigen Informationen eines Blocks zusammenzufassen. Auf dem umgekehrten Weg setzt der Avamar-Server aus der Hash-Datenbank und den Datenblöcken wieder die ursprüngliche Datenstruktur zusammen. Regelmäßig optimiert das System zudem den Datenbestand und löscht alle nicht mehr benötigten Daten. Somit bleibt auch bei steigendem Datenaufkommen das Wachstum relativ überschaubar.

Einer oder viele

Avamar-Systeme sind in zwei Varianten verfügbar. Bei der Single-Node-Lösung befinden sich beide Teile in einem System: der Utility-Node (der die Verwaltung übernimmt und bestimmt, welche Daten von welchem Server gespeichert und wo sie untergebracht werden) sowie der Storage-Node (das eigentliche Speicherarray). Ein solches System nimmt in einer RAID-5-Konfiguration maximal ein TByte Daten auf.

Bei einem Multi-Node-System enthält ein Server den Utility-Node und stellt zur Speicherung bis zu 16 Storage-Nodes zur Verfügung. Diese bilden ein sogenanntes »RAIN« (Redundant Array of Independent Nodes), dass ähnlich wie RAID die Daten über alle Nodes verteilt. Ein Speichergerät kann hierbei ausfallen, ohne dass die Daten verloren gehen.

Um die Sicherheit der Systeme zu gewährleisten, liefert FSC die Avamar-Lösung komplett mit Servern der PRIMERGY-Reihe aus. Der Avamar-Server selbst läuft unter Linux; die  Software-Agenten sind für alle offenen Betriebsysteme (z. B. Windows, Linux, Solaris und andere Unices, Novell) verfügbar. PRIMERGY-Server sind in vielen Modellvarianten erhältlich, die sich alle durch ein optimales Preis-Leistungs-Verhältnis auszeichnen.

Einsatzgebiete

Die Avamar-Lösung ist überall dort im Einsatz, wo es auf schnelle und sichere Verarbeitung der Daten ankommt. Das »Virginia Department of Motor Vehicles« beispielsweise ist mit dem hiesigen Straßenverkehrsamt vergleichbar. Hier sichert Avamar die Daten, die über jeden Autobesitzer gespeichert sind. Die Behörde verarbeitet in ihren 73 Außenstellen täglich mehrere tausend Datensätze. Die Herausforderung bestand darin, eine vernünftige Strategie für Backup und Datenschutz zu etablieren, die ein hohes Niveau an Datensicherheit und Verfügbarkeit garantiert.

Mit der Einführung von Avamar sank die Backupzeit von über zehn auf drei Stunden. Daten finden die Mitarbeiter jetzt innerhalb weniger Minuten statt erst nach Stunden. Selbst bei einem Datenverlust können die fehlenden Informationen in kurzer Zeit wiederbeschafft werden; der Besitzer muss sich nicht extra in die Behörde bemühen, um die Angaben erneut zu machen. Weitere Unternehmen, die auf die Avamar-Lösung setzen, sind das St. Peter’s Hospital in New York und der Internetprovider RIS.

Thomas Jungbluth

 

http://software.emc.com/collateral/storage_software/H2568_emc_avamar_ds_ldv.pdf

 

 

 

Avamar läuft optimal auf zertifizierten Servern von Fujitsu Siemens Computers.

 

 

Vorteile der Avamar-Deduplikation im Überblick

Globale Bereinigung von Datenduplikaten an der Quelle

Der Avamar-Server reduziert die täglich zu speichernden und sichernden Daten nach Angaben von EMC um das bis zu 300-fache. Durch den Avamar-Mechanismus werden Duplikate gar nicht erst über das Netzwerk transportiert. Somit sind schnelle und effiziente Backups auch über Wide Area Networks (WANs) möglich. Zudem ist der erforderliche Speicherplatz sehr viel geringer.

Täglich vollständige Remote Backups ohne großen Aufwand möglich

Durch Deduplikation ist sichergestellt, dass die Daten an Remote-Standorten vollständig geschützt sind. Unternehmen sind nicht davon abhängig, dass vor Ort ein IT-Mitarbeiter vorhanden ist, der die entsprechenden Tätigkeiten durchführt (z. B. Tape-Backup initialisieren, überwachen und anschließend die Bänder verschicken).

Verschlüsselung

Durch integrierte Algorithmen sind die Daten während der Übertragung und Speicherung jederzeit vollständig geschützt.

Zentralisiertes Management

Administratoren müssen Backup und Recovery nicht vom gleichen Standort wie das Speicher-Array aus durchführen, sondern können die Lösung zuverlässig aus der Ferne verwalten

Verifizierte Wiederherstellbarkeit

Avamar ermöglichen jederzeit eine Überprüfung der Datenwiederherstellbarkeit.

Einfache Wiederherstellung in einem Schritt

Kritische Daten lassen sich schnell und einfach retten. Der Recovery-Vorgang spart Zeit, weil die Administratoren nicht erst vollständige und ergänzte Backups wiederherstellen müssen, um Informationen zu retten.

 

 

Technische Informationen

EMC Avamar

Eingesetzte Hardware

Fujitsu Siemens Computers PRIMERGY RX300 mit Dual- oder Quad-Core Intel Xeon 5000 Prozessor, zwei über PCI-Express angebundene Onboard-Gbit/s-Ethernet-LAN-Ports, Serial Attached SCSI-RAID-Festplattencontroller (RAID Level 5) ebenfalls auf der Hauptplatine integriert. Mögliche Plattenkapazität intern max. 6 x 300-GB-SAS- oder 6 x 500-GB-SATA-Laufwerke, bis zu 5 PCIe und PCI-X Steckplätze, Hot-Plug-Komponenten, optional redundante Stromversorgung und zusätzliche Lüfter, Memory Mirroring-Option und Integrated Remote Management Controller (iRMC).

Speicherkapazität im Avamar-Einsatz

Single Node-Lösung: 1 Terabyte

Multi-Node-Lösung: je Node 1 TB

Unterstützte Applikationen

Microsoft Exchange

Microsoft SQL Server

Oracle

DB2

VMWare

NDMP für NetApp-Filer

Unterstützte Betriebssysteme

Windows

Solaris

Linux

AIX

HP-UX

Mac OS X

 

 

 

 

Folgen Sie »manage it«

auf Google+


 


 


 

 

 
Copyright © 2003-2012  ap Verlag GmbH