|
|
|
»manage
it«
als
|
EMC mit Avamar-Deduplikation auf FSC-Servern Mit Intelligenz Speicherplatz sparen und Bandbreite optimal nutzen Man braucht keine Marktforschung, um festzustellen, dass das Datenaufkommen in kleinen und mittleren Unternehmen nicht nur steigt, sondern geradezu explodiert. Mit seiner Avamar-Serverlösung bietet EMC einen Ansatz, durch intelligente Speicherung der Daten den vorhandenen Platz auf den Speichergeräten optimal zu nutzen. Das Zauberwort heißt: Deduplikation.
torage-Marktführer EMC übernahm im November 2006 die Firma Avamar und bietet deren Speziallösung für optimale Speicherung in seinem Portfolio an. Die Software wird auf einem dedizierten Gerät installiert, welches über das Netzwerk mit Applikations- und Datenbank-Servern verbunden ist. Dabei erhält jedes System einen Agenten zugeteilt, der dafür sorgt, dass der Avamar-Server nur mit den richtigen Daten beliefert wird. Redundanz beseitigen Analysiert man Daten, die gespeichert werden, fällt auf, dass vieles immer gleich ist. Bestimmte Informationen sind identisch, sei es beispielsweise auf Dateiebene der Header oder in einer Grafik das immer gleiche Bitmuster einer einfarbigen Fläche. So speichern Anwender viele Daten doppelt, dreifach, mehrfach – man spricht hier von »Redundanz«. Dieses Schema macht sich die Deduplikation zunutze: Der Agent analysiert die Daten auf dem DB- oder Applikationsserver und erzeugt daraus mittels eines Hash-Algorithmus einen »Fingerabdruck«. Statt der kompletten Daten übermittelt er zunächst nur diesen Fingerabdruck an den Avamar-Server. Existiert der Fingerabdruck noch nicht (etwa bei der erstmaligen Speicherung einer Datei), gibt der Avamar-Server grünes Licht, und die Daten werden zerlegt, übermittelt und gespeichert. Der Hash-Code wandert in eine Metadatenbank. Ist ein Datenblock der gleichen Art dort bereits zu finden und somit auf dem Avamar-Server vorhanden, werden nur die Änderungen gespeichert. Dadurch speichert der Avamar-Server identische Daten nur einmal. Das hat gleich mehrere Vorteile: Hauptsächlich spart man dadurch Storage-Kapazitäten, denn statt der mehrmals gleichen Datenblöcke werden nur unterschiedliche abgelegt. Je nach Art der Daten kann der Bedarf auf weniger als ein Prozent des ursprünglich benötigten Speicherplatzes sinken. Zudem verringert Deduplikation die I/O-Belastung auf den Datenleitungen zwischen den angeschlossenen Systemen und dem Avamar-Server erheblich, da hauptsächlich Fingerabdruckdateien geschickt werden. Das wiederum verkürzt die Zugriffszeiten im Gesamtsystem – Deduplikation bringt also einen Performance-Gewinn. Variable Blockgrößen Zur Optimierung trägt ferner bei, dass die Agenten die Daten intelligent analysieren und die Blockgröße an deren Art anpassen – sie liegt zwischen einem Byte und bis zu 64 KByte. Verschwindend gering ist dagegen der Fingerabdruck – nur 20 Byte benötigt das System, um alle wichtigen Informationen eines Blocks zusammenzufassen. Auf dem umgekehrten Weg setzt der Avamar-Server aus der Hash-Datenbank und den Datenblöcken wieder die ursprüngliche Datenstruktur zusammen. Regelmäßig optimiert das System zudem den Datenbestand und löscht alle nicht mehr benötigten Daten. Somit bleibt auch bei steigendem Datenaufkommen das Wachstum relativ überschaubar. Einer oder viele Avamar-Systeme sind in zwei Varianten verfügbar. Bei der Single-Node-Lösung befinden sich beide Teile in einem System: der Utility-Node (der die Verwaltung übernimmt und bestimmt, welche Daten von welchem Server gespeichert und wo sie untergebracht werden) sowie der Storage-Node (das eigentliche Speicherarray). Ein solches System nimmt in einer RAID-5-Konfiguration maximal ein TByte Daten auf. Bei einem Multi-Node-System enthält ein Server den Utility-Node und stellt zur Speicherung bis zu 16 Storage-Nodes zur Verfügung. Diese bilden ein sogenanntes »RAIN« (Redundant Array of Independent Nodes), dass ähnlich wie RAID die Daten über alle Nodes verteilt. Ein Speichergerät kann hierbei ausfallen, ohne dass die Daten verloren gehen. Um die Sicherheit der Systeme zu gewährleisten, liefert FSC die Avamar-Lösung komplett mit Servern der PRIMERGY-Reihe aus. Der Avamar-Server selbst läuft unter Linux; die Software-Agenten sind für alle offenen Betriebsysteme (z. B. Windows, Linux, Solaris und andere Unices, Novell) verfügbar. PRIMERGY-Server sind in vielen Modellvarianten erhältlich, die sich alle durch ein optimales Preis-Leistungs-Verhältnis auszeichnen. Einsatzgebiete Die Avamar-Lösung ist überall dort im Einsatz, wo es auf schnelle und sichere Verarbeitung der Daten ankommt. Das »Virginia Department of Motor Vehicles« beispielsweise ist mit dem hiesigen Straßenverkehrsamt vergleichbar. Hier sichert Avamar die Daten, die über jeden Autobesitzer gespeichert sind. Die Behörde verarbeitet in ihren 73 Außenstellen täglich mehrere tausend Datensätze. Die Herausforderung bestand darin, eine vernünftige Strategie für Backup und Datenschutz zu etablieren, die ein hohes Niveau an Datensicherheit und Verfügbarkeit garantiert. Mit der Einführung von Avamar sank die Backupzeit von über zehn auf drei Stunden. Daten finden die Mitarbeiter jetzt innerhalb weniger Minuten statt erst nach Stunden. Selbst bei einem Datenverlust können die fehlenden Informationen in kurzer Zeit wiederbeschafft werden; der Besitzer muss sich nicht extra in die Behörde bemühen, um die Angaben erneut zu machen. Weitere Unternehmen, die auf die Avamar-Lösung setzen, sind das St. Peter’s Hospital in New York und der Internetprovider RIS. Thomas Jungbluth
http://software.emc.com/collateral/storage_software/H2568_emc_avamar_ds_ldv.pdf
Avamar läuft optimal auf zertifizierten Servern von Fujitsu Siemens Computers.
Vorteile der Avamar-Deduplikation im Überblick Globale Bereinigung von Datenduplikaten an der Quelle Der Avamar-Server reduziert die täglich zu speichernden und sichernden Daten nach Angaben von EMC um das bis zu 300-fache. Durch den Avamar-Mechanismus werden Duplikate gar nicht erst über das Netzwerk transportiert. Somit sind schnelle und effiziente Backups auch über Wide Area Networks (WANs) möglich. Zudem ist der erforderliche Speicherplatz sehr viel geringer. Täglich vollständige Remote Backups ohne großen Aufwand möglich Durch Deduplikation ist sichergestellt, dass die Daten an Remote-Standorten vollständig geschützt sind. Unternehmen sind nicht davon abhängig, dass vor Ort ein IT-Mitarbeiter vorhanden ist, der die entsprechenden Tätigkeiten durchführt (z. B. Tape-Backup initialisieren, überwachen und anschließend die Bänder verschicken). Verschlüsselung Durch integrierte Algorithmen sind die Daten während der Übertragung und Speicherung jederzeit vollständig geschützt. Zentralisiertes Management Administratoren müssen Backup und Recovery nicht vom gleichen Standort wie das Speicher-Array aus durchführen, sondern können die Lösung zuverlässig aus der Ferne verwalten Verifizierte Wiederherstellbarkeit Avamar ermöglichen jederzeit eine Überprüfung der Datenwiederherstellbarkeit. Einfache Wiederherstellung in einem Schritt Kritische Daten lassen sich schnell und einfach retten. Der Recovery-Vorgang spart Zeit, weil die Administratoren nicht erst vollständige und ergänzte Backups wiederherstellen müssen, um Informationen zu retten.
Technische Informationen EMC Avamar Eingesetzte Hardware Fujitsu Siemens Computers PRIMERGY RX300 mit Dual- oder Quad-Core Intel Xeon 5000 Prozessor, zwei über PCI-Express angebundene Onboard-Gbit/s-Ethernet-LAN-Ports, Serial Attached SCSI-RAID-Festplattencontroller (RAID Level 5) ebenfalls auf der Hauptplatine integriert. Mögliche Plattenkapazität intern max. 6 x 300-GB-SAS- oder 6 x 500-GB-SATA-Laufwerke, bis zu 5 PCIe und PCI-X Steckplätze, Hot-Plug-Komponenten, optional redundante Stromversorgung und zusätzliche Lüfter, Memory Mirroring-Option und Integrated Remote Management Controller (iRMC). Speicherkapazität im Avamar-Einsatz Single Node-Lösung: 1 Terabyte Multi-Node-Lösung: je Node 1 TB Unterstützte Applikationen Microsoft Exchange Microsoft SQL Server Oracle DB2 VMWare NDMP für NetApp-Filer Unterstützte Betriebssysteme Windows Solaris Linux AIX HP-UX Mac OS X
|
Folgen Sie »manage it« auf Google+
|