20090506h Mayato Data Mining

 Home | News | Hefte | Mediadaten | Online-Artikel | Kommentare | Trends | Wir-ueber-uns | Tipps | Impressum | CeBIT 2012

 

Home
News
Trends
Hefte
Online-Artikel
Kommentare
Service-Angebote
Feedback
Abonnement
Wir-ueber-uns
Tipps
Impressum
Veranstaltungen


»manage it« als

E-Paper  5-6 2011
E-Paper  3-4 2011
E-Paper  1-2 2011
E-Paper  11-12 2010
E-Paper  9-10 2010

E-Paper  7-8 2010
E-Paper  5-6 2010
 




 

 


 




 


 


 

 

 

Modernes Data Mining

Data-Mining-Projekte bieten Chancen und Risiken

Die Zeiten, in denen sich Unternehmen brachliegende Daten leisten können, sind laut Marktforschern wie Gartner vorbei. Die gute Nachricht: Vorbei sind auch die Zeiten, in denen Data Mining ausschließlich von Statistik-Experten in kostenintensivem, monatelangem Fein-Tuning betrieben werden konnte.

 

A

nders als bei einfachen Reports oder OLAP-Analysen geht es beim Data Mining um das Auffinden von Mustern, die mit bloßen Auge trotz intensiver Analyse nicht erkennbar sind, sich aber sehr wohl mit Hilfe von intelligenten Algorithmen aufspüren lassen. Typische Anwendungsgebiete finden sich verstärkt im Bereich des Kundenbeziehungsmanagements (CRM), in der Kundensegmentierung, bei Warenkorbanalysen und dem Erkennen von Cross-Selling-Potenzialen sowie bei Frühwarnsystemen für Kundenabwanderung oder Betrug. Hinzu kommen Anwendungen in Einkauf, Produktion, Qualitäts- und Reklamationsmanagement – zum Beispiel bei der Prognose von Ersatzteilausfällen und Beschaffungsbedarf. Data Mining rechnet sich vergleichsweise schnell durch mehr Effizienz, zusätzliche Umsätze oder auch vermiedene Verlusten. Nicht selten erreichen Business Cases eine Größenordnung von mehreren Millionen Euro.

Kostentreiber und Risiken

Traditionelles Data Mining ist Spezialisten vorbehalten: Die Erstellung von Modellen und die Aufbereitung der Daten erfordern Expertenwissen, sie nehmen teilweise Monate in Anspruch. Dieser Aufwand treibt nicht nur die Kosten von Data-Mining-Analysen in die Höhe, sondern beschränkt auch deren Anzahl. Hinzu kommt die Ungewissheit, ob sich überhaupt relevante Muster in den gegebenen Daten finden lassen: Selbst mit dem besten Werkzeug ist nicht in jedem Berg eine Goldader zu finden. Bis zu dieser Erkenntnis hat ein traditionelles Data-Mining-Projekt häufig schon Personentage in sechsstelliger Höhe mit den entsprechenden Kosten verschlungen. Hinzu kommen Lizenzkosten von nicht selten mehreren 100.000 Euro und jährliche Wartungskosten in fünf- bis sechsstelliger Höhe. Weitere Investitionen in Millionenhöhe können durch den Aufbau einer Data-Warehouse-Infrastruktur entstehen.

In den letzten Jahren entstanden jedoch eine Reihe alternativer Ansätze, die das Verhältnis von Risiken und Chancen von Data-Mining-Projekten positiv verschoben haben. In der Open-Source-Welt sind Produkte wie Rapidminer, KNIME oder Weka verfügbar, die einen ähnlich mächtigen Funktionsumfang aufweisen wie klassische Data-Mining-Suiten von SAS oder SPSS. Den Einsparungen bei Lizenzkosten steht jedoch im Normalfall ein erhöhter Aufwand durch weniger gute Prozessunterstützung und kompliziertere Bedienung gegenüber. Für statistische Laien sind diese Werkzeuge kaum beherrschbar. Eine andere Option ist die Nutzung bereits im Unternehmen vorhandener Lizenzen für Datenbank- oder Data-Warehouse-Software. So finden sich Data-Mining-Funktionen und -Algorithmen in den Softwarelösungen von Oracle und Microsoft. Und auch Benutzer von IBM- oder SAP-Lösungen sollten sich nach zusätzlichen Data-Mining-Features erkundigen.

Schnupperkurs für Data Mining

Einen Umbruch im Markt stellen im Hinblick auf Projektdauer und einfache Anwendung vor allem Produkte für das Self-Acting Data Mining dar, wie zum Beispiel das Analytic Framework von KXEN. Sie nehmen den Anwendern durch einen automatisierten Ansatz die Arbeit der Datenvorbereitung und Parametrisierung weitgehend ab. Projektlaufzeiten gehen deutlich zurück, sodass erste Ergebnisse schon nach wenigen Tagen verfügbar sind. So lässt sich schon relativ früh sagen, ob vorhandene Daten überhaupt weitere Investitionen rechtfertigen. Auch für Unternehmen, die mehrere Hundert Modelle im Jahr im Jahr erstellen, ergibt sich durch den Zeitgewinn ein Kostenvorteil. Durch die einfachere Bedienbarkeit erschließt sich das Self-Acting Data Mining auch für Fachanwender und rückt jetzt erstmals für Mittelständler in Reichweite. Mittlerweile lassen sich einige Data-Mining-Werkzeuge auf Monatsbasis zu Preisen im vierstelligen Euro-Bereich mieten. Für eine gezielte Fragestellung wie zum Beispiel die Ermittlung von Cross-Selling-Potenzialen liegen die Kosten für ein Pilotprojekt mit Software und Beratung bei unter 20.000 Euro – Kosten, die sich in vielen Fällen schon durch die im Pilotprojekt gewonnenen Erkenntnisse amortisieren.

Dr. Marcus Dill

 

Dr. Marcus Dill, Geschäftsführer des BI-Analysten- und Beratungshauses mayato GmbH.

Folgen Sie »manage it«

auf Google+


 


 


 

 

 
Copyright © 2003-2012  ap Verlag GmbH