Wiki

Data Mining

Was ist Data Mining?

Data Mining bezeichnet Methoden, mit denen vor allem Data Scientists neue Werte aus Daten erschließen können. Konkret handelt es sich um Algorithmen aus der Statistik sowie Verfahren der Künstlichen Intelligenz, die automatisiert unbekannte Muster, Trends und Zusammenhänge in vorhandenen Datenbeständen aufdecken. Die gewonnenen Erkenntnissen werden schließlich für die Neuentwicklung oder Optimierung von digitalen Prozessen und Produkten genutzt.

Die Methoden des Data Minings generieren auf unterschiedliche Weise neues Wissen aus Daten. Sie lassen sich unterteilen in:

  • Klassifikation: Datenobjekte werden definierten Klassen zugeordnet, wie zum Beispiel bei der datengestützten Diagnose von Krankheiten.
  • Segmentierung: Objekte mit gemeinsamen Merkmalen werden zusammengefasst, beispielsweise Kunden in bestimmte Kundengruppen.
  • Prognose: Unbekannte Merkmale werden auf Basis vorhandener Merkmale oder neuer Erkenntnisse vorhergesagt, wie etwa bei der Prognose von Maschinenausfällen
  • Abhängigkeitsanalyse: Zwischen den Merkmalen von einem Objekt oder verschiedenen Objekten werden Beziehungen identifiziert. So können Zusammenhänge in Daten beispielsweise auf bestimmte Marktentwicklungen hinweisen.
  • Abweichungsanalyse: Es werden Objekte ermittelt, die den Regeln der Abhängigkeiten anderer Objekte nicht entsprechen. Aus der Ursachen für die Abweichung resultiert dann die Erkenntnis, etwa dass spezifische Temperaturgrenzwerte eingehalten werden müssen, damit sich Bauteile bei der Produktion nicht verformen.

Durch die Anwendung der Data-Mining-Methoden auf Big Data – also große Mengen an strukturierten und unstrukturierten Daten – lassen sich im Regelfall noch bessere Ergebnisse mit höherer Relevanz erzielen.

Data Mining und der KDD-Prozess

Data Mining

Data Mining wird oftmals als synonym für die „Knowledge Discovery from Databases“ (KDD) verstanden, einem breit angelegten Prozess zur Wissensgewinnung aus Daten. Letztlich handelt es sich aber nur um einen Teilbereich dieser Disziplin – wenn auch um einen ganz entscheidenden. Generell reicht der KDD-Prozess von vorbereitenden Untersuchungen über die Datentransformation bis zur Evaluation und Visualisierung der Ergebnisse. Data Mining nimmt hierbei die zentrale Rolle der Datenanalyse ein, die neue Erkenntnisse hervorbringt und den übergeordneten Unternehmenszielen zur Verfügung stellt.

Voraussetzungen für Data Mining

Um Data Mining erfolgreich betreiben zu können, ist nicht nur umfangreiches Know-how in den Bereichen Informatik, Mathematik und Statistik erforderlich. Ebenso müssen Unternehmen spezielle technische Voraussetzungen schaffen. Etabliert hat sich ein modernes Data Warehouse in der Cloud, bei dem strukturierte und unstrukturierte Daten in einem Data Lake gesammelt und zur weiteren Erforschung vorgehalten werden. Data Scientist hat somit einerseits Zugriff auf die kompletten Rohdaten. Andererseits kann er diese mit konsolidierten Stammdaten verknüpfen. Das fördert den Erkenntnisgewinns und damit den Nutzen für die Digitalisierung des Geschäftes.

Wollen auch Sie mit Data Mining neue Werte für Ihr Unternehmen, Ihre Kunden und Ihre Mitarbeiter gewinnen? Dann schauen Sie auf der Big Data Engineering vorbei oder informieren Sie sich über unser Training Microsoft Modern Data Warehouse: Cloud-Plattformen aufbauen und geschäftlich nutzen.

turn your data into value.

Microsoft Modern Data Warehouse

Cloud-Plattformen aufbauen und geschäftlich nutzen

Sichern Sie sich Ihr Geschäft von Morgen! Mit einem Modern Data Warehouse (MDWH) können Sie Ihren Daten vollkommen neue Werte entlocken. Begeistern Sie Kunden und Mitarbeiter mit digitalen Services auf der Basis von Internet of Things und Echtzeit-Streaming. Unser Training vermittelt Ihnen die technischen Grundlagen in der Azure Cloud.

Join #teamoraylispeople

Gestalte mit uns
die Welt der Daten