Data Mining vs. Abfragetools
Abfragetools sind Tools, die bei der Analyse der Daten in einer Datenbank helfen. Sie bieten Funktionen zum Erstellen, Bearbeiten, Suchen, Finden, Berichten und Zusammenfassen von Abfragen. Andererseits ist Data Mining ein Gebiet der Informatik, das sich mit der Extraktion bisher unbekannter und interessanter Informationen aus Rohdaten beschäftigt. Daten, die als Eingabe für den Data-Mining-Prozess verwendet werden, werden normalerweise in Datenbanken gespeichert. Benutzer, die der Statistik zugeneigt sind, verwenden Data Mining. Sie verwenden statistische Modelle, um nach verborgenen Mustern in Daten zu suchen. Data Miner sind daran interessiert, nützliche Beziehungen zwischen verschiedenen Datenelementen zu finden, was letztendlich für Unternehmen profitabel ist.
Data-Mining
Data Mining wird auch als Knowledge Discovery in Data (KDD) bezeichnet. Wie oben erwähnt, handelt es sich um ein Gebiet der Informatik, das sich mit der Extraktion bisher unbekannter und interessanter Informationen aus Rohdaten beschäftigt. Aufgrund des exponentiellen Datenwachstums, insbesondere in Bereichen wie der Wirtschaft, ist Data Mining zu einem sehr wichtigen Werkzeug geworden, um diese große Datenfülle in Business Intelligence umzuwandeln, da die manuelle Extraktion von Mustern in den letzten Jahrzehnten scheinbar unmöglich geworden ist. Beispielsweise wird es derzeit für verschiedene Anwendungen wie die Analyse sozialer Netzwerke, Betrugserkennung und Marketing verwendet. Data Mining befasst sich normalerweise mit den folgenden vier Aufgaben: Clustering, Klassifizierung, Regression und Assoziation. Clustering identifiziert ähnliche Gruppen aus unstrukturierten Daten. Klassifikation sind Lernregeln, die auf neue Daten angewendet werden können und typischerweise die folgenden Schritte umfassen: Vorverarbeitung von Daten, Entwerfen von Modellen, Lernen/Merkmalsauswahl und Bewertung/Validierung. Regression findet Funktionen mit minimalem Fehler zu Modelldaten. Und Assoziation sucht nach Beziehungen zwischen Variablen. Data Mining wird normalerweise verwendet, um Fragen zu beantworten, z. B. welche Hauptprodukte dazu beitragen könnten, im nächsten Jahr bei Wal-Mart hohe Gewinne zu erzielen
Abfragetools
Abfragetools sind Tools, die helfen, die Daten in einer Datenbank zu analysieren. Normalerweise verfügen diese Abfragetools über ein GUI-Frontend mit bequemen Möglichkeiten zur Eingabe von Abfragen als Satz von Attributen. Sobald diese Eingaben bereitgestellt sind, generiert das Tool tatsächliche Abfragen, die aus der zugrunde liegenden Abfragesprache bestehen, die von der Datenbank verwendet wird. SQL, T-SQL und PL/SQL sind Beispiele für Abfragesprachen, die heute in vielen populären Datenbanken verwendet werden. Dann werden diese generierten Abfragen gegen die Datenbanken ausgeführt und die Ergebnisse der Abfragen werden dem Benutzer auf organisierte und klare Weise präsentiert oder gemeldet. Typischerweise muss der Benutzer keine datenbankspezifische Abfragesprache kennen, um ein Abfragetool zu verwenden. Hauptmerkmale der Abfragetools sind ein integrierter Abfragegenerator und -editor, zusammenfassende Berichte und Zahlen, Import- und Exportfunktionen und erweiterte Such-/Suchfunktionen.
Was ist der Unterschied zwischen Data Mining und Abfragetools?
Abfragewerkzeuge können zum einfachen Erstellen und Eingeben von Abfragen in Datenbanken verwendet werden. Abfragetools machen es sehr einfach, Abfragen zu erstellen, ohne eine datenbankspezifische Abfragesprache lernen zu müssen. Andererseits ist Data Mining eine Technik bzw. ein Konzept in der Informatik, das sich damit beschäftigt, nützliche und bisher unbekannte Informationen aus Rohdaten zu extrahieren. Meistens werden diese Rohdaten in sehr großen Datenbanken gespeichert. Daher können Data Miner die vorhandenen Funktionalitäten von Abfragetools verwenden, um Rohdaten vor dem Data Mining-Prozess vorzuverarbeiten. Der Hauptunterschied zwischen Data-Mining-Techniken und der Verwendung von Abfragetools besteht jedoch darin, dass die Benutzer zur Verwendung von Abfragetools genau wissen müssen, wonach sie suchen, während Data-Mining hauptsächlich dann verwendet wird, wenn der Benutzer eine vage Vorstellung davon hat, was er tut suchen.