|
|
|
»manage
it«
als
|
Datenbank-Archivierung bringt Kostenersparnisse und Performance-Anstieg Datenbankarchivierung wichtiger Bestandteil einer ILM-Strategie Datenbanken sind in vielen Firmen mit dem Dreifachen der eigentlichen Nutzgröße überfrachtet. Nur eine kontinuierliche und inkrementelle Datenbankarchivierung kann hier Abhilfe schaffen.
und 85 Prozent aller Daten in Datenbanken sind inaktiv, weil sie nur noch wegen gesetzlicher oder unternehmensinterner Vorschriften aufbewahrt werden. Dies zeigt eine aktuelle Studie von Forrester Research, in der die Datenbankarchivierung als wichtiger Bestanteil einer Strategie für Information Lifecycle Management (ILM) hervorgehoben wird. Alle Daten im Online-Zugriff aufzubewahren, birgt für die Anwenderunternehmen nicht unerhebliche Risiken: In Datenbanken werden nicht nur steuerlich relevante Daten vorgehalten, sondern auch Qualitätssicherungsdaten, Prozess-, Produktions- sowie auch Verwaltungsdaten von Drittsystemen, wie zum Beispiel Indexdaten aus einem Content-Management-System. Diese Massendaten werden in den Produktivsystemen abgelegt, wodurch die Datenbanksysteme explosionsartig wachsen. Wendet man die üblichen Sicherungsmechanismen für Datenbanken an und legt Indizes für schnelle Zugriffe auf die Daten, so erreicht der Speicherbedarf in vielen Unternehmen schnell mindestens das Dreifache der eigentlichen Nutzgröße.
Compliance-Richtlinien fordern lange Aufbewahrungszeiten Hinsichtlich der elektronischen Archivierung gelten für die meisten Unternehmen, teilweise auch in Abhängigkeit der Branche, bestimmte gesetzliche oder auch unternehmensinterne Vorschriften. Relevante nationale und internationale Compliance-Regelungen sind beispielsweise in diesem Zusammenhang der Sarbanes-Oxley Act (SOX), die GDPdU, Basel II sowie der Code of Federal Regulations CFR 17. In diesen Richtlinien finden sich klare Vorgaben zu Arten und Formaten der Aufbewahrung bestimmter Daten und Informationen sowie zu den jeweiligen Fristen. Insbesondere wird auch die sichere Aufbewahrung und Transparenz gefordert. Die Aufbewahrungsdauer kann von einigen Jahren bis hin zu mehreren Jahrzehnten vorgegeben sein. Ein Beispiel für branchenspezifische Regularien stellt das Federal Register CFR Part 11 dar, ein weltweit anerkanntes Regelwerk für standardisierte Herstellungsmethoden im Pharma- und Lebensmittelbereich. Bei der Erfüllung dieser Vorgaben werden Unternehmen von den geeigneten technischen Lösungen und einem gut konzipierten Archiv unterstützt. Daten in Datenbankmanagementsystemen sicher archivieren Wichtige Eigenschaft der Datenbankarchivierung ist die Beachtung relationaler Abhängigkeiten und die Unterstützung veränderter Strukturen. Diese gewährleistet, dass Daten im Archiv konsistent zum verwendeten Datenbankschema sind. Gerade weil Datenbanken über einen längeren Zeitraum verwendet werden, sind Änderungen, beispielsweise in der Struktur selbst oder auch in Bezug auf die Semantik, fast unvermeidlich. In den meisten Unternehmen ändert sich die Datenbankstruktur über einen Zeitraum von mehreren Jahren sogar recht häufig. Zu den strukturellen Änderungen gehören beispielsweise umbenannte Tabellen oder neu hinzugefügte Spalten. Auch kann es immer wieder sein, dass vorhandene Spalten gelöscht werden. Bei den semantischen Änderungen kommen Namensänderungen von Städten, Abteilungen oder Werken vor. Solche speziellen Veränderungen erfordern eine manuelle Unterstützung durch einen Administrator. Jedoch können bei der Archivierung von Datenbanken syntaktische und semantische Änderungen identifiziert und im Archiv protokolliert werden. Unterstützt die Datenbankarchivierung diese Anforderungen, lassen sich die Archivdaten beim Restore in ein vom Anwender gewünschtes Datenbankschema laden und ist so benutzerfreundlich und schnell zu durchsuchen oder in eine Datenbank zurück zu importieren. Damit dies möglich ist, müssen die Archivdaten technisch von der Originalstruktur der eingesetzten relationalen Datenbank gelöst und in einem offenen, textbasierten Format, gespeichert werden. Das offene Format kann mit Standardalgorithmen komprimiert werden, um Plattenplatz zu sparen. Die Datenbankarchivierung ermöglicht einen einheitlichen Zugriff auf die archivierten Daten, selbst wenn sich die Datenbank über Jahre oder Jahrzehnte hinweg kontinuierlich verändert hat oder verändern wird. Durch die Verwendung eines offenen Formats ist der Anwender langfristig unabhängig von einem bestimmten Softwareanbieter. Die Daten stehen ihm uneingeschränkt und dauerhaft für Recherchen zur Verfügung. Verwendet die Datenbankarchivierung dagegen ein proprietäres Format, besteht die Gefahr, dass im Laufe der Jahre Produkte und Hersteller vom Markt verschwinden und die Software nicht mehr weitergepflegt wird. In diesem Falle wäre der Zugriff auf die archivierten Datenbanken möglicherweise nach einer gewissen Zeit nicht mehr gegeben. Für die reinen Archivdaten empfiehlt sich ein textbasiertes Format. Die Verwendung von XML ist empfehlenswert für die Metadaten, weil hier die anfallenden Datenmengen nicht so groß sind und XML für die Anwender durch die selbstbeschreibende Eigenschaft leicht zu lesen ist. Zu den Metadaten der archivierten Daten zählen Informationen über Tabellen, Spalteninformationen, Constraints, Grants und Indizes, die sich somit wieder vollständig rearchivieren lassen. Werden die archivierten Metadaten der Archive dazu genutzt, Änderungen in der Datenstruktur zu beschreiben, sind die Daten auch über mehrere Datenbankentwicklungssprünge hinweg nutzbar. Unterschiedliche Schemata können ansonsten nicht gemeinsam behandelt werden. Anhand der hinterlegten Metadaten kann das aktuelle Schema der Datenbank geprüft werden. Bestehen Inkonsistenzen, sollte die Software automatisiert Vorschläge unterbreiten, wie die Archivdaten in das neue Schema importiert werden können. In Bezug auf die Langzeitarchivierung sind daher die Architektur der Datenbankarchivierung und die Verwendung technologischer Standards besonders wichtige Kriterien. Die Datenkonsistenz bei Archivierungs- und Wiederherstellungsvorgängen muss jederzeit gewährleistet und auch das Wiederherstellen der Daten im Produktivsystem selbst sollte möglich sein, damit für die Anwender ein komfortables Arbeiten möglich ist.
Von Vorteil ist es, die Datenbanken kontinuierlich und inkrementell zu archivieren. Dann werden beim Archivierungsvorgang nur die Daten gesichert, die seit dem letzten Archivlauf neu hinzugekommen sind und den Archivierungskriterien entsprechen. Mit der inkrementellen Archivierung lässt sich zum einen Plattenplatz sparen, zum anderen können bestimmte Daten auch schnell ausgewählt und flexibel wieder hergestellt werden. Hohe Kosteneinsparung im Storage-Bereich Bei einer Beispielrechnung wurde ein Betrag von 13 Euro als Kosten für Storage pro Monat pro Gigabyte zugrunde gelegt und von einem prozentualen Wachstum einer Datenbank zwischen 15 bis 20 Prozent ausgegangen. Die Daten sollen zwei Jahre lang in der Datenbank verbleiben, ältere Datensätze werden ins Archiv verschoben. Bei einer Datenbank, die zu Beginn der Archivierung eine Größe von 250 Gigabyte aufweist, betragen die Einsparungen nach zehn Jahren summiert rund 1,5 Millionen Euro. Ein anderes Beispiel zeigt die enormen Einsparungen schon nach dem kurzen Archivierungszeitraum von drei Jahren: Bei einer Startgröße der Datenbank von 360 Gigabyte lassen sich die Storagekosten mit der Datenbankarchivierung in drei Jahren schon um 300.000 Euro reduzieren. Diese beiden Rechenbeispiele zeigen, wie relevant das Thema Datenbankarchivierung heute für fast jedes Unternehmen ist. Resümee: Ein Umdenken der IT-Leiter ist erforderlich. Anstatt in immer leistungsfähigere Serverhardware zu investieren, lohnt die Implementierung einer Datenbankarchivierung, um einerseits die aufbewahrungspflichtigen Daten vor einem Verlust zu schützen, die Kosten für Storage zu senken und die Produktivdatenbank performant zu halten. Stefan Brandl _____________________________________________________________________ Stefan Brandl ist Produktmanager Datenbankarchivierung bei CSP GmbH & Co. KG, Großköllnbach
|
|