Was ist Data Mining und wie kann es kleinen Unternehmen helfen?

Business Mann in einer Mine

Was ist das Erfolgsrezept vieler erfolgreicher Internetfirmen? Und warum werden sie auch in Zukunft den Markt dominieren? Bei der Antwort auf diese Fragen geben viele Experten „Data Mining“ als Grund an. Doch was ist Data Mining eigentlich genau und wieso hat es ein so großes Potential?

  • Hinter den personalisierten Empfehlungen auf der Amazon-Website steht genau das: Data Mining. Aus diesem Grund hat Amazon sich entschieden, in den Lebensmittelvertrieb einzusteigen und das ist gar nicht mal so verrückt, wie es klingt, zumindest in den USA. In Deutschland tut sich der Lieferdienst von Lebensmitteln generell schwerer.
  • Facebook wurde zu einem milliardenschweren Unternehmen, weil das Unternehmen mithilfe von Data Mining-Methoden der riesigen Nutzerbasis extrem gezielte und vor allem konvertierende Werbung zeigt.
  • 88 Prozent der Suchanfragen über Desktop-PCs weltweit werden über Google ausgeführt, da dieser Dienst relevantere Suchergebnisse liefert als die Mitbewerber – aufgrund von Data Mining.

Auch kleinen Unternehmen stehen viele Daten zur Verfügung: Rechnungen, Bestandsunterlagen und Tabellenkalkulationen ohne Ende. Mithilfe dieser Informationen schafft man es doch gewiss an die Spitze, oder?

Mathemathische Formeln fliegen im Raum herum

Was ist Data Mining? Auf den ersten Blick für manche ein ziemliches Rätsel.

Und genau an dieser Stelle wird klar, dass die Bezeichnung „Data Mining“ trügerisch ist. Schnell bekommt man den Eindruck, dass man sich nur genug anstrengen muss, um erfolgreich zu sein. In den ganzen Daten muss sich der berühmte Topf mit Gold befinden, bzw. die Informationen, die sich zu Geld machen lassen.

Aber so läuft es leider nicht. Was nicht heißt, dass Data Mining keine Option für kleine Unternehmen ist. Ganz im Gegenteil, genau wie für Amazon und Google ist Data Mining auch ausschlaggebend für deren Zukunft.

Wir sehen uns nachfolgend an, wie Data Mining wirklich vonstattengeht und wie die Ergebnisse eingesetzt werden können. Zudem stellen wir auch einige erschwingliche Data Mining-Tools vor, die kleine Unternehmen in Betracht ziehen sollten.

Was ist Data Mining?

Das Gabler Wirtschaftslexikon definiert Data Mining als „die Anwendung von Methoden und Algorithmen zur möglichst automatischen Extraktion empirischer Zusammenhänge zwischen Planungsobjekten, deren Daten in einer hierfür aufgebauten Datenbasis bereitgestellt werden.“

Einfach gesagt nutzen Data Mining-Methoden Statistiken und Modellierung, um große Mengen unterschiedlicher Daten zu analysieren und mögliche Muster und Verbindungen festzustellen.

Wie funktioniert Data Mining?

Bei dem Begriff „Data Mining“ denkt man zuerst, dass man sich auf der Suche nach neuen Daten befindet. Tatsächlich werden aber bereits vorhandene Daten auf Bezüge, Muster und Trends untersucht.

Dabei wird meistens in drei Schritten vorgegangen:

Schritt 1: Datenquellen identifizieren

Befindet man sich in einem Einzelhandelsgeschäft, werden bei jedem Kauf mit einer Geldkarte Daten wie der Kundenname, der Zeitpunkt des Kaufs und die erworbenen Produkte in einem Kassensystem gesammelt. Bei einem Online-Geschäft stehen für jeden Besucher einer Website Informationen zur Verfügung: Kamen die Besucher über Twitter, YouTube oder eine andere Quelle und welche Seiten haben sie sich angeschaut? Das sind äußert nützliche Informationen! Wenn diese noch nicht gesammelt werden, sollte dies schleunigst in einer Tabelle oder einer Software festgehalten werden. Anschließend untersucht man Quellen auf mögliche Muster.

Schritt 2: Zu analysierende Datenpunkte aus Quellen auswählen

Am besten wäre es, wenn man einfach nur zwei riesige Datenbanken in einen Computer speisen müsste und dieser sämtliche möglichen Korrelationen lernen würde, aber die Technik ist noch nicht ganz so weit. Software benötigt Anweisungen und muss wissen, wo sie nach Mustern suchen soll. Es hat sich daher als bewährte Vorgehensweise herauskristallisiert, bestimmte Datenpunkte festzulegen, bei denen nach einem Kausalzusammenhang gesucht wird. Der monatliche Umsatz und die Anzahl der Kunden mit Vorname Daniel stehen sehr wahrscheinlich nicht in Korrelation. Die Uhrzeit und wie viele Personen sich zu diesem Zeitpunkt im Laden befinden hingegen schon.

Schritt 3: Ein Modell anwenden und testen, das Datenpunkte am besten verknüpft

Bei diesem Punkt schalten die meisten Leute ab, daher wollen wir es mit einem einfachen Beispiel in Microsoft Excel verdeutlichen. Nehmen wir einen Eiswagen und stellen fest, inwieweit das Wetter sich auf den Verkauf auswirkt. Über 30 Tage hinweg werden die Höchsttemperatur und die Anzahl der verkauften Eistüten festgehalten:

Beispiel für Data Mining

Auf den ersten Blick sieht es so aus, als ob sich hier ein Trend abzeichnet. Wichtiger ist jedoch, dass eine bloße Betrachtung nicht ausreicht, um einen quantifizierbaren Zusammenhang zwischen diesen Datensätzen herzustellen.

Fügt man jedoch eine Trendlinie hinzu – eine gerade Linie in Excel, mit der in diesem Fall gezeigt wird, dass sich die Anzahl der verkauften Eiswaffeln mit dem Wetter ändert – so lassen sich andere Aussagen treffen. Hierbei wird folgendes Modell angewendet:

Beispiel für Data Mining

Jetzt können wir deutlich sehen, dass mit Ausnahme weniger Ausreißer der Verkauf von Eis bei gutem Wetter zunimmt. Es geht aber noch besser. Wir können auf diese beiden Datensätze auch eine einfache Formel anwenden (=CORREL), um einen sogenannten Korrelationskoeffizient zu erhalten: eine Zahl, die sich in der Statistik zwischen +1 und -1 bewegt und Auskunft über die Abhängigkeit zweier Datensätze voneinander gibt. +1,00 zeigt eine perfekte positive Korrelation an (steigt die Temperatur um ein Grad, so wird auch ein weiteres Eis verkauft) und -1,00 eine perfekte negative Korrelation (steigt die Temperatur um ein Grad, so wird ein Eis weniger verkauft). Der Wert 0,00 zeigt an, dass es keinerlei Zusammenhang gibt.

Der Korrelationskoeffizient für die hier vorliegenden Temperatur-/Eisdaten liegt bei 0,67, was auf eine kleine positive Korrelation schließen lässt.

Und das ist im Grunde schon Data Mining. Wir haben uns zwei unterschiedliche Datensätze genommen und ein Muster gefunden, das sie verbindet. Nun könnten wir dem Modell weitere Daten zum Testen hinzufügen und sicherstellen, dass es weiterhin richtig ist.

An dieser Stelle soll jedoch noch einmal betont werden, dass es sich hier um ein sehr vereinfachtes Beispiel handelt. Ausschlaggebender wäre es, wenn wir uns anstelle von 30 Tagen mit 30.000 Tagen beschäftigen würden. Hinzu kommen noch weitere Faktoren, die Einfluss auf die Zahlen haben, ob es zum Beispiel an den einzelnen Tagen geregnet hat oder auf einmal das Schokoladeneis ausgegangen war. Und die beste Linie ist auch keine Gerade, sondern eine wilde Kurve. Spätestens an dieser Stelle wird klar, warum Software für Data Mining unabdingbar ist.

Wie nutze ich Data Mining zu meinem Vorteil?

Verborgene Muster in den Geschäftsdaten zu finden kann faszinierend sein, aber letztendlich ist die ganze Arbeit umsonst, wenn man das dadurch erhaltene Wissen nicht auch zur Geschäftsoptimierung einsetzt. Wir stellen daher einige Möglichkeiten vor, wie Unternehmen Data Mining-Methoden zu ihrem Wettbewerbsvorteil nutzen können.

  • Saisonalität identifizieren:Mithilfe von Data Mining lassen sich die besten Zeiten für Preiserhöhungen bzw. Preisreduzierungen ermitteln. Das amerikanische Warenhaus Macy’s analysiert mit erweiterten Data Mining-Methoden die Nachfrage und Bestandszahlen für das Online-Geschäft und passt die Preise für mehr als 73 Millionen Artikel in Echtzeit
  • Höhere Ausgaben fördern:Über das Data Mining lässt sich herausfinden, welche Artikel häufig zusammen gekauft oder angesehen werden und so können in einigen Fällen Vorratskäufe empfohlen werden. Walmart fand so heraus, dass Kunden bei schlechtem Wetter vermehrt Batterien, Notfallausrüstung und Erdbeer-Pop Tarts In Gegenden mit unfreundlichem Wetter erhöhten sie daher ihre Pop Tart-Vorräte und konnten den Umsatz steigern.
  • Bessere Mitarbeiter einstellen:Arbeitgeber setzen Data Mining auch zunehmend ein, um die Eigenschaften von Bewerbern festzustellen, die später zu leistungsstarken Mitarbeitern werden. Xerox fand heraus, dass der in einem Persönlichkeitstest sogenannte „kreative Typ“ länger in den Trainingsprogrammen dabeiblieb, wodurch die Abbruchrate um 20 Prozent gesenkt wurde.
  • Marketinganstrengungen verbessern: Aufgrund des Data Mining von Kundendaten lassen sich neue Marketingstrategien wie E-Mail- und Social Media-Kampagnen für verschiedene Kundensegmente entwickeln. Intermix teilte seine Kunden in drei klar voneinander getrennte Gruppen auf und bewarb jede davon mit unterschiedlichen E-Mail-Angeboten, was zu einem um 15 Prozent erhöhten Jahresumsatz führte.
  • Kosten senken: Data Mining kann nicht nur zum Verdienen, sondern auch zum Sparen eingesetzt werden. UPS konnte 148 Millionen Liter Benzin einsparen, indem sie nicht mehr links abbogen.

Data Mining-Tools für kleine Unternehmen

Schon überfordert? Das ist verständlich. Data Mining ist hochkomplex und so mag es auf den ersten Blick erscheinen, als sollten sich nur hochqualifizierte Datenanalysten in großen Unternehmen damit auseinandersetzen.

Dieser Schein trügt jedoch. Das Forschungs- und Beratungsunternehmen Gartner schätzt, dass der Markt für Business Intelligence und Analysesoftware bis 2020 auf mehr als 22 Milliarden USD anwachsen wird und ein Großteil dieses Wachstums durch kleine und mittelständische Betriebe entsteht. Immer mehr erschwingliche Data Mining-Tools werden auch für diese Unternehmen zugänglich.

Hier einige Data Mining-Tools für kleine Unternehmen mit Top-Bewertungen:

Für Vermarkter: Google Analytics

Ein Screenshot des Data Mining Tools Google Analytics

Glücklicherweise teilt Google ein paar seiner Data Mining-Geheimnisse mit uns. Mit Google Analytics können Unternehmen kostenlos so einiges über ihre Website erfahren: Wie viele Leute besuchen sie und wie lange bleiben sie dort, welchen Browser nutzen sie und vieles mehr. Data Mining-Experten gehen noch einen Schritt weiter und kombinieren Google Analytics mit der bekannten Programmiersprache für statistische Berechnungen und Grafiken R. Hier wird in einem Tutorial gezeigt, wie das funktioniert (Englisch).

Für Verkaufsteams: InsightSquared

Ein Screenshot des Data Mining Tools

InsightSquared wurde speziell für kleine und mittlere Unternehmen entwickelt und analysiert CRM-Daten, wobei Verkaufsmuster und Trends visuell dargestellt werden. Das Ergebnis ist ein differenzierter Blick auf den Verkaufstrichter, wodurch Verkaufschancen wahrgenommen und übersichtliche Berichte für Stakeholder schnell und einfach erstellt werden. Personalvermittler können mithilfe von InsightSquared ihre Mitarbeiter nicht nur schneller und preisgünstiger, sondern auch zu passenderen Stellenangeboten vermitteln.

Für Power-User: Periscope Data

Ein Screenshot des Data Mining Tools

Unternehmen mit anspruchsvollen Anforderungen sollten sich näher mit Periscope Data beschäftigen. Datenteams können mit Periscope mehrere Datenbanken integrieren und so in Echtzeit Zugriff auf Datenvisualisierung, Dashboards und Berichte erhalten, die mit individuell angepassten Nutzergruppen innerhalb des Unternehmens geteilt werden können. Ein eingebetteter SQL-Editor unterstützt das Schreiben von Anfragen, wodurch Unternehmen mithilfe von Data Mining mehr über ihre Daten und Kunden herausfinden als jemals zuvor.

Dies sind nur ein paar Beispiele. Weitere Produkte findest du auf unserer Software-Seite für Data Mining. Wir hoffen, die Antwort auf die Frage „Was ist Data Mining?“ ist für dich ein wenig klarer geworden und du hast einige Ideen bekommen, wie du es selbst einsetzen könntest!

Vorsicht: Bei Data-Mining immer auf DSGVO-Konformität prüfen:

Man befindet sich hier in einem Graubereich, da der Begriff Data-Mining in der DSGVO nicht explizit erwähnt wird und lediglich als Teilgebiet des Profiling gesehen werden kann. Grundsätzlich betrifft die DSGVO personenbezogene und nicht anonymisierte Daten. Trotzdem sollte die Erhebung und Verarbeitung von Daten in diesem Fall immer individuell auf DSGVO-Konformität überprüft werden.