Data Mining – Muster und Trends frühzeitig entdecken

Data Mining – Muster und Trends frühzeitig entdecken

Im Zusammenhang mit Big Data, Internet of Things und Cognitive Computing/Künstliche Intelligenz haben wir schon oft das Buzzword Data Mining gehört. Doch was verbirgt sich überhaupt dahinter? Die freie Übersetzung ins Deutsche, also „Daten abbauen“, hilft da auch nicht wirklich weiter. Also schauen wir uns die systematische Anwendung einmal genauer an.

Große Datenmengen durchschauen

Data Mining ist der Begriff „Knowledge Discovery in Databases“ übergeordnet. Der Prozess des Entdeckens von Wissen in großen Datenbanken beschreibt die Verarbeitung der Daten mittels computergestützter Methoden. Data Mining im Speziellen bezeichnet dagegen lediglich den eigentlichen Verarbeitungsschritt dieses Prozesses, also die Wissensgewinnung durch das Auslesen bereits vorhandener Daten.

Die Arbeitsweise der Methode kann in fünf Phasen unterteilt werden, wobei es sich um einen iterativen Prozess handelt:

1. Datenquellen
(Relationale Datenbanken oder NoSQL-Datenbanken)
Hier werden folgende Prozesse ausgeführt:

  • Data cleaning (Entfernung von inkonsistenten Daten)
  • Data integration (Zusammenführen von mehreren Datenquellen)

2. Data Warehouse
(Repository mit Informationen, die aus mehreren Quellen gesammelt wurden)
Folgende Prozesse werden in dieser Phase ausgeführt:

  • Data selection (Für die Analyseaufgabe relevante Daten werden aus der Datenbank abgerufen)
  • Data transformation (Daten werden transformiert und in Formulare konsolidiert)

3. Data Mining
(Essentieller Prozess, bei dem intelligente Methoden zur Extraktion von Datenmustern eingesetzt werden)

4. Pattern Evaluation
(Identifizieren von interessanten Mustern, die relevantes Wissen repräsentieren)

5. Knowledge Presentation
(Präsentieren des gewonnenen Wissens mit Hilfe von Visualisierungstechniken)

Durch Methoden wie Assoziation, Pfadanalyse, Klassifizierung und Cluster-Bildung ist es möglich, Vorhersagen zu treffen, die zu gewinnbringenden Prognosen für die Zukunft führen können (vgl. Predictive Maintenance).

Dabei ist jedoch zu beachten, dass das Verfahren zwar Muster erkennen, daraus aber nicht die Wichtigkeit und Wertigkeit dieser Informationen für ein Unternehmen ableiten kann. Es ist daher wichtig, dass ein Unternehmen selbst seine Daten versteht und so die Ergebnisse des Data Mining-Verfahrens interpretieren, auswerten und zu neuen Strategien umsetzen kann.

Data Mining in der Praxis

Nachdem wir nun viel über theoretische Strukturen und Abläufe des Data Mining erfahren haben, ist es an der Zeit, den praktischen Gebrauch kennenzulernen. Wo und wie werden die statistischen Methoden der Datenanalyse also angewendet? Neben der Anwendung in vielen Forschungsgebieten wie der Mathematik, der Kybernetik oder der Genetik, arbeiten bereits viele Unternehmen mit Customer Relationship Management-Systemen (CRM), die auf Web Mining, einer Form des Data Minings, beruhen.

Ohne es zu bemerken, ist der Prozess mittlerweile auch in unserem Alltag angekommen und analysiert beispielsweise das Kaufverhalten bestimmter Kundengruppen. Data Mining erfasst diese enormen Datenmengen und erkennt darin neue Muster und Beziehungen. Dadurch können nun Cross Selling-Marketing-Methoden des Einzelhandels optimiert und deutlich effektiver eingesetzt werden.

Kommentar verfassen

Durch die Nutzung dieser Webseiten erklären Sie sich mit der Verwendung von Cookies einverstanden. Nähere Informationen über die Verwendung und den Zweck von Cookies auf diesem Internetportal erhalten Sie in unserer Datenschutzerklärung | Einverstanden