Unterschied zwischen Data Mining und Data Warehousing

Unterschied zwischen Data Mining und Data Warehousing
Unterschied zwischen Data Mining und Data Warehousing

Video: Unterschied zwischen Data Mining und Data Warehousing

Video: Unterschied zwischen Data Mining und Data Warehousing
Video: 25 FAKTEN ÜBER Pokemon FEUERROT und BLATTGRÜN welche du vielleicht nicht kennst! 2024, Juli
Anonim

Data Mining vs. Data Warehousing

Data Mining und Data Warehousing sind beides sehr mächtige und beliebte Techniken zur Datenanalyse. Benutzer, die der Statistik zugeneigt sind, verwenden Data Mining. Sie verwenden statistische Modelle, um nach verborgenen Mustern in Daten zu suchen. Data Miner sind daran interessiert, nützliche Beziehungen zwischen verschiedenen Datenelementen zu finden, was letztendlich für Unternehmen profitabel ist. Aber auf der anderen Seite neigen Datenexperten, die Dimensionen des Geschäfts direkt analysieren können, dazu, Data Warehouses zu verwenden.

Data Mining wird auch als Knowledge Discovery in Data (KDD) bezeichnet. Wie oben erwähnt, handelt es sich um ein Gebiet der Informatik, das sich mit der Extraktion bisher unbekannter und interessanter Informationen aus Rohdaten befasst. Aufgrund des exponentiellen Datenwachstums, insbesondere in Bereichen wie der Wirtschaft, ist Data Mining zu einem sehr wichtigen Werkzeug geworden, um diese große Datenfülle in Business Intelligence umzuwandeln, da die manuelle Extraktion von Mustern in den letzten Jahrzehnten scheinbar unmöglich geworden ist. Beispielsweise wird es derzeit für verschiedene Anwendungen wie die Analyse sozialer Netzwerke, Betrugserkennung und Marketing verwendet. Data Mining befasst sich normalerweise mit den folgenden vier Aufgaben: Clustering, Klassifizierung, Regression und Assoziation. Clustering identifiziert ähnliche Gruppen aus unstrukturierten Daten. Klassifikation sind Lernregeln, die auf neue Daten angewendet werden können und typischerweise die folgenden Schritte umfassen: Vorverarbeitung von Daten, Entwerfen von Modellen, Lernen/Merkmalsauswahl und Bewertung/Validierung. Regression findet Funktionen mit minimalem Fehler zu Modelldaten. Und Assoziation sucht nach Beziehungen zwischen Variablen. Data Mining wird normalerweise verwendet, um Fragen zu beantworten, z. B. welche Hauptprodukte dazu beitragen könnten, im nächsten Jahr bei Wal-Mart hohe Gewinne zu erzielen

Wie oben erwähnt, wird Data Warehousing auch zum Analysieren von Daten verwendet, jedoch von unterschiedlichen Benutzergruppen und einem etwas anderen Ziel vor Augen. Im Einzelhandel beispielsweise interessieren sich Data-Warehousing-Anwender mehr dafür, welche Arten von Einkäufen bei Kunden beliebt sind, sodass die Ergebnisse der Analyse dem Kunden helfen können, indem sie das Kundenerlebnis verbessern. Aber Data Miner stellen zunächst eine Hypothese auf, z. B. welche Kunden einen bestimmten Produkttyp kaufen, und analysieren die Daten, um die Hypothese zu testen. Data Warehousing könnte von einem großen Einzelhändler durchgeführt werden, der seine Geschäfte zunächst mit Produkten derselben Größe auf Lager hat, um später herauszufinden, dass New Yorker Geschäfte kleinere Bestände viel schneller verkaufen als Geschäfte in Chicago. Anhand dieses Ergebnisses kann der Einzelhändler den Laden in New York im Vergleich zu den Läden in Chicago mit kleineren Größen führen.

Also, wie Sie deutlich sehen können, scheinen diese beiden Arten der Analyse mit bloßem Auge von der gleichen Art zu sein. Beide machen sich Sorgen um steigende Gewinne auf der Grundlage historischer Daten. Aber natürlich gibt es entscheidende Unterschiede. Einfach ausgedrückt sind Data Mining und Data Warehousing darauf ausgerichtet, verschiedene Arten von Analysen bereitzustellen, aber definitiv für verschiedene Arten von Benutzern. Mit anderen Worten, Data Mining sucht nach Korrelationen, Mustern, um eine statistische Hypothese zu stützen. Aber Data Warehousing beantwortet eine vergleichsweise umfassendere Frage und schneidet und würfelt Daten von dort an, um Verbesserungsmöglichkeiten in der Zukunft zu erkennen.

Empfohlen: