INHALTSVERZEICHNIS
1 EINFÜHRUNG *
2.1 Planungsphase ( Verstehen der Problemstellung, Business Understanding ) *
2.2 Vorbereitungsphase ( Datensammlung und Datenaufbereitung, Data *
2.3 Datensammlung und Datenauswahl *
2.7 Welche Daten kann ich analysieren? *
2.8 Wie sehen die Ergebnisse einer Analyse aus? *
3.2 Fallbasiertes Schliessen *
EINFÜHRUNG
Die Analyse der Daten ist die wichtigste Voraussetzung für die Darstellung und Entwicklung von intelligenten Systemen. Diese stellen die Quelle der Erfahrungen des Systems dar. Die Kenntniserfindung mit Hilfe der Data Mining Techniken kann die vorher nicht im ersten Blick ehrscheinbaren Zusammenhänge aus einem Haufen von Daten destillieren und auf diese Weise zu einem besser angepassten System führen.
Data Mining ist es, aus großen Datenbeständen versteckte Informationen, Trends und Vorhersagen abzuleiten und sogar Zusammenhänge zu erkennen, an die vor der Analyse gar nicht gedacht wurde. Dabei wird versucht mit Hilfe von Data Mining, Muster in Datenbeständen zu identifizieren, Unterschiede zwischen Gruppen von Datensätzen zu erkennen, die charakteristischen Attribute der Gruppen zu bestimmen, repräsentative Beispiele für Datenzusammenhänge zu finden oder Gleichungen für numerische Variablen auf Basis des Datenbestandes zu erzeugen. Die Ergebnisse solcher Analysen sind mit Angaben über ihre Eintrittswahrscheinlichkeit (Verlässlichkeit) in einer verständlichen Form darzustellen.
Data Mining ist der Prozess automatisch, vorher unbekannte, statistisch korrekte, interessante und interpretierbare Muster und Zusammenhänge in großen Datenmengen zu finden. Data Mining soll für wichtige Unternehmungsentscheidungen genutzt werden. Im strengeren Sinne ist Data Mining die Analyse von Daten. Bei Data Mining finden Techniken des Maschinellen Lernens (Künstliche Intelligenz) und der Statistik Verwendung.
" Traue keiner Statistik, es sei denn Du hast sie selber gefälscht."
Es gibt keine eindeutige Vorgehensweise, sodass kein eindeutiges Ergebnis geben kann, welches als die Wahrheit akzeptiert werden muss. Für die Bewertung der Analyse und für die Auslegung der Ergebnisse muss immer die Erfahrung von Sachverständigen herangezogen werden. Wenn die entsprechende Sorgfalt nicht gegeben ist, konnte folgendes Ergebnis akzeptiert werden:
" Der Rückgang der Störch korreliert positiv mit dem Geburtenrückgang. "
Data Mining behandelt das warum und nicht das was. Nehmen wir zum Beispiel die Gesamtverkäufe durch elektronischem Wege in einem Geschäft an. Mit Hilfe des Data Minings kann man sehr leicht herausfinden, warum die Gesamtverkäufe bei einem bestimmten Produkt oder einer bestimmten Dienstleistung gestiegen sind und warum bestimmte Online-Besucher mit einer bestimmten Postleitzahl und Zugehörigkeit zu einer Altersgruppe etwas Bestimmtes aus dem Online-Katalog gekauft haben, und andere nicht.
Data Mining sagt, warum bestimmte Online-Besucher dazu neigen, immer wieder Produkte und Dienstleistungen bei diesem Geschäft zu kaufen, und andere nicht. Beim Data Mining geht es darum, warum der Traffic in den WebsiteTraffic-Reports so ist, wie er ist.
Data Mining betrifft auch die Frage, wer. Wer besucht zum Beispiel die Website des Geschäftes und kauft die Produkte und Dienstleistungen, wer sind die treuesten und profitabelsten Online-Kunden? Data Mining beschäftigt sich mit Verhältnismäßigkeiten, Regeln, Attributen, Merkmalen, Mustern, und Einfluss-Faktoren, die in den Daten einer Website verborgen sind. Es soll die Gründe und Zusammenhänge hinter den Zahlen der Zugriffs-Statistik aufdecken. Darüber hinaus zeigt es die wichtigsten Unterschiede zwischen Online-Besuchern, Online-Kunden, zwischen Dienstleistungen, Produkten und Verkäufen. Data Mining behandelt das warum und wer, nicht das wie viele. Es kann zur
Beantwortung folgender Fragen dienen:
Beim Data Mining geht es um den Einsatz von autonomen Mustererkennungs-Technologien zur Erreichung eines bestimmten Geschäftszieles, zum Beispiel der Steigerung der Online-Verkäufe.(WebMining) Es geht um Wahrnehmung, Lernen und Weiterentwicklung – ebenso wie die menschlichen Funktionen, die dem Unternehmen helfen, sich in der schnelllebigen E-Commerce-Umgebung zurecht zu finden. Das Ziel von Data Mining kann beispielsweise die Vergrößerung der Marktanteile des Geschäftes durch das Ermitteln Ihrer wertvollsten Online-Kunden sein.
Meistens können folgende Fragen beantwortet werden:
Data Mining ist ein Prozess, der nicht als eine einzelne Methode angesehen werden darf. Er besteht aus fünf Phasen und in denen können bestimmte Methoden verwendet werden. Die Grundlage des Prozesses sind die Daten in einer Datenbank
Unternehmen verfügen in einem immer größer werdenden Umfang über elektronisch
gespeicherte firmenspezifische und firmenexterne Daten. Durch eine professionelle
Aufbereitung können strategische Informationen zur Verbesserung der eigenen
Wettbewerbsfähigkeit gewonnen werden.
Die Muster und Zusammenhänge, die in den Daten existieren, sind nicht offensichtlich und daher mit herkömmlichen Methoden auch nicht entdeckt werden. Mit Data Mining steht ein methodisches Werkzeug bereit, um genau diese Lücke zu schließen. Bislang unbekannte Zusammenhänge werden entdeckt und zur Verbesserung der unternehmerischen Position verwendet.
Dies erfolgt in einem prozessartigen Modell. Data-Mining-Prozess soll als iterativer Prozess erfasst werden, der sich aus fünf Phasen zusammensetzt.
Der wichtigste Schritt in dieser Phase ist das Festlegen der konkreten Aufgabenstellung:
Das sind Z.B. welche Ziele sollen durch das Data Mining erreicht werden? Welche Ergebnisse werden erwartet? Kurzgefasst ,es soll festgestellt werden, welchem Einsatzgebiet des Data-Minings die Problemstellung entspricht.
Darüber hinaus ist es wichtig, dass die richtigen Personen in den Data-Mining -Prozess eingebunden sind: Ohne Beteiligung von Experten des jeweiligen Sachgebiets ist ein sinnvolles Data-Mining nur in den einfachsten Fällen möglich.
Understanding)

In dieser Phase werden die zu verwendeten Daten und Informationen vorbereitet. Ergebnis dieser Phase ist eine Mining Base, die die Ausgangsbasis für die weiteren Transformations- und Analyseschritte darstellt.
Es muss entschieden werden, welche Informationen für den Prozess verwendet werden sollen und in welche Form diese Daten zur Verfügung stehen. Die Extraktion der relevanten Daten findet aus einer geeigneten Datenquelle statt. Data-Mining –Systeme können mit vorhandenen Data-Ware-Systemen gekoppelt werden, sind aber nicht auf den Zugriff auf ein Data-warehouse beschränkt. So können die Daten auch direkt aus den operativen Datenbanken oder aus externen Datenquellen beschafft werden. Dieser Teil der Vorbereitungsphase ist für die Mustererkennung von besonderer Bedeutung, da die Datengrundlage für den gesamten Data-Mining –Prozess festgelegt wird.
Die Selektion (Datenauswahl) hat die Aufgabe, aus der großen Anzahl vorhandener Datenbanken, Tabellen, Datensätze und Attribute jene auszuwählen, die inhaltlich relevant erscheinen. Unter Umständen müssen einzelne Daten zusätzlich nacherhoben werden. Das betrifft vor allem
-
Meta-Daten: Daten, die die verwendeten Daten näher beschreiben.-
Hintergrundwissen (optional): Regeln, die bekannte Zusammenhänge in den Daten beschreiben und dem Data –Mining- Algorithmus in maschinell lesbarer Form zur Verfügung stehen sollen.
In dieser Phase wird die Datenqualität des selektierten Datenpools untersucht. Aufgrund technischer oder menschlicher Fehler können die Daten operativer Systeme fehlerhafte Elemente enthalten. In der Praxis wird damit gerechnet, dass 1%-5% der Felder des Datenbestandes falsche Angaben aufweisen.
Bei der Data Preprocessing soll man auf die noisy data und missing values beachten.
Eine Fehlerart wird durch Ausreißer hervorgerufen. Dabei handelt es sich um Werteausprägungen, die deutlich vom Niveau der übrigen Werte abweichen. Bei diesen Ausprägungen kann es sich um korrekt erfasste Daten handeln, die damit Eingang in die Analyse finden, oder aber um falsche Angaben, die nicht berücksichtigt werden dürfen und daher aus dem Datenbestand zu löschen sind. Beispiele für noisy data kann z.B. das Alter einer Person, das als 650 initialisiert ist oder ein negatives Einkommen sein. Wir wissen schon, dass diese Werte nicht realisierbar sind.
Ein anderer Typ von Ausreißern entsteht dann, wenn die Änderungen in operationalen Systemen nicht in die Data-Mining –Umgebung weitergeleitet werden können z.B. Kodierungen, die für neue Produkte mit operationalen Systemen vertraut gemacht werden, erscheinen als Ausreißer. In diesem Fall scheint es keine andere Lösung zu geben, außer die Daten zu aktualisieren.
z.B. In einem Diagramm kann es erkannt werden, dass die Mehrheit der Personen in einer Zielgruppe ein geringes Einkommen hat und nur wenige von denen von ihrem hohen Einkommen profitieren. Es könnte sein, dass die arme Datenaufsammlung diese Ausprägung verursacht hat. z.B. die Gruppe könnte hauptsächlich von Pensionisten gebildet sein und deswegen die anderen Personen mit ihren mittelmäßigen Einkommen im ersten Blick als wertvolle Verdienenden interpretiert werden.
Eine häufige, leicht zu identifizierende Fehlerart besteht in fehlenden Werten (missing values). Sie beinhalten Werte, die in der ausgewählten Data nicht repräsentiert sind oder die wir bei der noisy data-Ermittlung gelöscht haben. Wegen menschlicher oder technischer Fehler könnten die Daten unvollständig sein, da die notwendige Informationen beim Input nicht verfügbar waren, oder sie aus verschiedenen heterogenen Quellen erfasst wurden.
Zur Behandlung von fehlenden Werten stehen unterschiedliche Techniken zur Verfügung. So kann der Datensatz, der fehlende Werte aufweist, aus dem Datenbestand gelöscht werden. Dies kann jedoch zu einer Verfälschung der Analyseergebnisse führen. Im Falle, wobei das Datenvolumen groß ist, hat dieser Verlust keinen großen Effekt auf dem Data-Mining-Prozess, aber bei kleinerem Datenvolumen wird es zu Problemen führen.
Die Erkenntnisse, die der Nutzer eines Data-Mining –Systems in dieser Phase der Vorarbeitung über den Datenbestand gewinnt , kann Hinweise auf die Verbesserung der Datenqualität der operativen Systemen geben .

In dieser Phase findet die eigentliche Suche nach interessanten Mustern statt. Die Erfahrungen, die im Laufe dieser Phase gewonnen werden, können es notwendig machen, Schritte aus der Vorbereitungsphase zu wiederholen, um z.B. zusätzliche Daten in die Mining Base zu inkludieren.
Ergebnis dieser Phase ist meist eine große Anzahl komplexer Musterbeschreibungen, wie sie von den einzelnen Data Mining-Algorithmen erstellt werden.
In dieser Phase wird versucht, die Ergebnisse aus der Mining Phase so aufzubereiten, dass sie auch für Nichtexperten verständlich sind.
Anwenden des gewonnenen Wissens: Insbesondere in kommerziellen Anwendungen wird das aus dem Data Mining Prozess gewonnenen Wissen oft zur Unterstützung eines Entscheidungsprozesses verwendet, beim Data-Mining Prozess handelt es sich daher um einen Decision Support Process.
Welche Daten kann ich analysieren?
Alle Daten tragen Informationen, die potenziell wichtig für eine Analyse sein können. An dieser Stelle sei nur eine kleine Auswahl der möglichen Quellen genant:
Wie sehen die Ergebnisse einer Analyse aus?
Die Ergebnisse hängen stark von der anschließenden Verwendung ab. Es können explizite Erkenntnisse sein ( z.B. Zu wenig gute Kunden ), oder auch Datenmaterial, welches für die Steuerung von Prozessen verwendet wird ( z.B. Kundenliste für Prospektversand ).
Das können sein:
Das Ergebnis eines Projekts kann jedoch auch ein Computersystem sein, welches automatisch, jede Woche wiederkehrend die aktuellen Ergebnisse erstellt und in angeschlossene Produktionsprozesse weitergibt.
Hat Web Minig etwas mit Data Mining zu tun?
Mit Web Mining wird die Anwendung von Data Mining Techniken auf Internet Daten bezeichnet. Die Daten, die bei der Nutzung des Internets anfallen, zeichnen sind durch eine bisher nicht vorhandene Detailliertheit aus. Zum Beispiel sind die Wege der Kunden durch einen Kaufhaus selten so transparent, wie in einem e-commerce Shop im Internet. Mit WebMining werden die Daten der Benutzerinteraktionen jeglicher Art (z.B. Web Server Log) herangezogen, um Muster im Verhalten der Benutzer zu identifizieren.
Mittels Data Mining können Kostensparpotenziale aufgedeckt, die Kundenbindung gestärkt und die bereits vorhandenen Daten nach fachspezifischen Erkenntnissen durchgesucht werden. Die Erfahrung zeigt, dass schon die Datenaufbereitung das Verständnis für die gesammelten Daten verbessert und dem Unternehmen zeigt, welchen Informationsreichtum es besitzt. Die extrahierten Erkenntnisse können dann direkt in Profit umgewandelt werden
ÜBERSICHT ÜBER DIE METHODEN DES DATA MINING
Die Methoden zur Klassifikation ermitteln Muster, die es erlauben, noch nicht bekannte Aussagen über Objekte zu treffen. In einem ersten Schritt werden Projekte in Gruppen zusammengefasst, die sich durch charakteristische Attribut und gleiches Verhalten bezüglich des zu untersuchenden Problems auszeichnen.
Bei der Korrelationsanalyse geht es darum, Beziehungen zwischen verschiedenen Daten dadurch zu finden, dass man die Werte bestimmter Attribute in den Datensätzen vergleicht. Lässt sich bei einem signifikant großen Teil der Werte eine feste Relation, etwa Gleichheit oder ein funktionaler Zusammenhang wie x= f(y), feststellen, dann gelten die Daten als korreliert.
Bei der Hauptkomponentenanalyse geht es darum, die jenigen Attribute von Datensätzen zu bestimmen, die die Datensätze charakterisieren, d.h. die, die wichtigsten zur Beschreibung der Datensätze sind. In der Regel ist dies nur ein kleiner Teil der Attribute, und es ist dann möglich, sich bei weiteren Untersuchungen der Datensätze auf diese Attribute zu beschränken.
Die Regressionsanalyse untersucht Zeitreihendaten. Sie betrachtet die in der Vergangenheit etwa bei Reihenmessungen angefallenen Daten und versucht, aus dem zeitlichen Verlauf eines einzelnen oder mehrerer Werte den nächst folgenden Wert bzw. die nächst folgenden Werte zu prognostizieren.
Die Abweichungsanalyse beschäftigt sich mit Objekten, die sich keinem Muster eindeutig zu ordnen lassen. Bei diesen( Ausreißern) kann es sich um fehlerfreie interessante Merkmalsausprägungen handeln oder aber um fehlerhafte Daten, die keine realen Sachverhalte beschreiben. Die Zielsetzung der Abweichungsanalyse besteht darin, die Ursachen für die untypischen Merkmalsausprägungen des Ausreißers aufzudecken. Wird ein Ausreißer im Datenbestand identifiziert, so durchsucht das Data Mining Tool alle Datenbestände, um die Einflussfaktoren zu erklären, die zu einer abweichenden Merkmalsausprägung geführt haben. Handelt es sich bei einem Ausreißer um einen fehlerhaften Wert, wird diese aus dem Datenbestand eliminiert. Da auf diese Weide die Datenqualität gesteigert wird, werden Methoden zur Abweichungsanalyse bereits in der Phase der Vorverarbeitung eingesetzt.
Die Diskriminanzanalyse dient zur Trennung von Gruppen durch eine Kombination von Merkmalen und zur Einordnung von Objekten mit unbekannter Gruppenzugehörigkeit in die Gruppen.
Die Clusteranalyse teilt eine gegebene Menge von Objekten in Gruppen auf. Dabei werden die Cluster so gebildet, dass die Ähnlichkeit der Objekte in den Clustern möglichst groß und die Ähnlichkeit der Objekte in verschiedenen Clustern möglichst gering ist.
Die Idee des fallbasiertes Schließens ist, Beispiele geloster Probleme aus einem bestimmten Anwendungsbereich abzuspeichern um sie später zur Losung neuer, aber ähnlich gearteter Probleme heranziehen zu können. Dazu müssen die Beispielprobleme zusammen mit ihrer Losung in einem geeigneten Format dargestellt werden und in einer speziellen Datenbank, der Fallbasis, abgespeichert werden.
Ein Paar bestehend aus Problembeschreibung und zugehöriger Losung heißt Fall. Liegt ein neues Problem vor, dann muss diese zunächst in dem vorgegebenen Format dargestellt werden. Dann können die Problembeschreibungen der in der Fallbasis vorhandenen Fälle durchsucht werden um eine zum neuen Problem möglichst ähnliche Beschreibung zu finden. Dafür benötigt man ein Ähnlichkeitsmaß für die Problembeschreibungen. Der Fall mit der ähnlichsten Problembeschreibung wird angenommen und seine Losung als mögliche Losung des neuen Problems ausgegeben. Eine Anpassung der gefundenen Losung an die neuen Gegebenheiten kann u.U. erforderlich sein.
Ein neuronales Netz ist ein gerichteter Graph, der aus Knoten und Kanten besteht. Diese Knoten sind selbstständig rechnende Einheiten. Die Kanten verbinden die Knoten in verschiedenen Formen, wodurch sich unterschiedliche Typen von Netzen ergeben. Durch die Feststellung, ob der Graph zyklenfrei ist oder nicht, unterscheidet man zwei Hauptklassen von Neuronalen Netzen.
1-Feed Forward Netze
2-Rekurrenten Netze
Häufig sind die Knoten in Schichten unterteilt. Diese Schichten sind geordnet als
S1. ......,Sn
Die Kanten werden nur zwischen Knoten aufeinander folgender Schichten gesetzt. d.h. nur zwischen Si und Si+1 (i=1,............n-1)
Verborgene Schichten
Die Knoten bestehen aus zwei Teilen. Jeder Teil wird durch eine Funktion gebildet. Die beiden Teile ( die beiden Funktionen) sind nacheinander angeordnet, d.h. die Ausgabe der ersten Funktion ist die Eingabe der zweiten Funktion.
Die erste Funktion erhält ihre Eingaben über die Kanten, die zu ihr führen, von den vorgeschalteten Knoten, und die zweite Funktion überträgt ihre Ausgabe über Kanten an nachgeschaltete Knoten.
Die erste Funktion ist eine Integrationsfunktion, die aus der Menge der Eingaben einen Wert berechnet. Meist wird dazu die Addition benutzt. Die zweite Funktion ist als Aktivierungsfunktion genannt. Diese Aktivierungsfunktion ist meist eine Schwellenwertfunktion. Bei mehrschichtigen Netzen ist es insbesondere die Sigmoidfunktion wegen der einfachen Differenzierbarkeit. Die Eingänge in den Knoten sind gewichtet. Jeder Eingang hat ein eigenes Gewicht.
X1 W1 X2 W2
X4
W5 Aktivierungsfunktion
X5
Ein neuronales Netz kann trainiert werden, man sagt auch: Es kann lernen. Die einfachste Form des Lernens ist das überwachte Lernen. Man gibt dem Netz eine Reihe von Beispielen in beliebiger Reihenfolge und wiederholt ein. Für jedes Beispiel ist bekannt, was die gewünschte Ausgabe sein soll. Stimmt die Ausgabe des Netzes für ein Beispiel mit der gewünschten überein, dann nichts getan zu werden. Weichen tatsächliche und gewünschte Ausgabe voneinander ab, dann müssen die Gewichte im Netz verändert werden, dass sich der Fehler bei der Ausgabe verringert. Dieser Prozess erfolgt im Idealfall, solange bis alle Beispiele richtig berechnet werden. Das Netz ist nun trainiert und repräsentiert eine bestimmte Funktion. Damit ist es in der Lage, neue Beispiele zu berechnen, d.h. einen mutmaßlichen Funktionswert für diese auszugeben.
Genetische Algorithmen dienen dazu, automatische Näherungen mathematischer Formeln aus Rohdaten zu gewinnen. Sie orientieren sich bei der Suche nach diesen Formeln an den Prinzipien der Zeugung und des Aufbaus von biologischen Populationen.
Ein Genom ist eine Folge von Genen. Die Gene sind die elementaren Informationseinheiten genetischer Algorithmen. Im einfachsten Fall sind sie kurze Bitstrings. Die genetischen Algorithmen erzeugen in einer großen Schleife immer neue Generationen von Genomen durch Anwendung von Operationen Selektion, Kreuzung und Mutation.
Die folgenden Schritte werden durchgeführt:
Das Ziel des Algorithmus ist die Fitness der Genome zu maximieren. Die Fitnessfunktion, die beliebig definiert sein kann, bewertet jedes neu entstandene Genom. Durch die Operation Selektion werden bei jedem Durchlauf durch die Schleife des Algorithmus eine bestimmte Anzahl von Genomen eliminiert, sie sorgt also dafür, dass die Größe der Population konstant bleibt. Gleichzeitig werden die fittesten Genome für die nächsten Operationen ausgewählt.
Bei der Operation Kreuzung werden zwei Genome an einer bestimmten Stelle aufgetrennt und die beiden Bruchstücke über Kreuz zu neuen Genomen kombiniert.
Die Operation Mutation verändert ein oder mehrere zufällig ausgewählte Gene in einem Genom, wodurch ebenfalls ein neues Genom entsteht.
n-te Generation Selektion (n+1)-te Generation
Kreuzung
Mutation
Die Konstruktion von Entscheidungsbäumen ist eine Form des Maschinelles Lernens. Man kann diese Form des Lernens auch als induktives oder überwachtes Lernen bezeichnen. Dabei bekommt der jenige Lerner eine Menge von Beispielen vorgelegt und soll daraus eine Funktion erlernen.
Die Beispiele haben die Form von Paaren(x,f(x)).
X ist die Eingabe und f(x) die Ausgabe der zu lernenden Funktion.
Es sei eine Menge von Datensätzen mit n Attributen gegeben. Jeder Datensatz charakterisiert ein bestimmtes Objekt und wird als Beispiel bezeichnet. Eines der Attribute wird als Zielattribut ausgewählt oder es wird ein neues Attribut als Zielattribut eingefügt.
In der Regel wird von dem Algorithmus eine graphische Struktur aufgebaut, und zwar ein Baum. Die Knoten des Baums werden von den Beispielmengen gebildet, insbesondere der Wurzelknoten von der Menge aller am Anfang vorliegenden Beispiele, die Kanten von den Werten des an einem Knoten ausgesuchten Attributs. Die Beschriftung eines Wegs von der Wurzel zu einem Blatt beschreibt,unter welchen Bedingungen , d.h. bei welchem Wert für das jeweils ausgewählte Attribut, die am Blatt stehende Menge zustande kommt. Der Entscheidungsbaum kann als Klassifikator verwendet werden, er gibt für jedes neue Beispiel an, zu welchem Blatt es gehört.
Zur Klassifikation von Objekten werden im Rahmen von Data Miningsystemen häufig Entscheidungsbaumorientierte Methoden eingesetzt. Zwar können auch Methoden der künstlichen Intelligenz zur Klassifikation eingesetzt werden, doch verfügen Entscheidungsbäume über ein höheres Maß an Transparenz, da die Klassifikationsregeln direkt aus dem Entscheidungsbaum ablesbar sind.
Problematisch wird die Anwendung von Entscheidungsbäumen, wenn der generierte Baum aus vielen Ebenen besteht und durch die Vielzahl von Verzweigungen unübersichtlich wird. In diesem Fall ist die Tiefe des Baums durch entsprechende Pruning-Verfahren zu reduzieren. Da zur Generierung von Entscheidungsbäumen effiziente Algorithmen zur Verfugung stehen, wird dieses Verfahren vielen Data Mining Systemen unterstützt.
BP brachte 1986 ein Expertensystem mit Namen GASOIL zum Einsatz. Sein Zweck war der Entwurf von Gas-Öl-Trennanlagen für Offshore-Ölplattformen. Die Trennung von Gas und Öl erfordert ein sehr großes, komplexes und teures Trennsystem, dessen Entwurf eine Anzahl von Attributen betriff, u.a. die relativen Anteile von Gas, Öl und Wasser, die Flussrate, den Druck, die dichte, die Viskosität und die Temperatur. Obwohl die Trennung von Öl und Gas normalerweise jahrelange Erfahrungen von wissenschaftlichen Untersuchungen erfordert, kann sie dank dem Entscheidungsbaum-lernverfahren auf eine Datenbasis von existierenden Entwürfen sehr leicht geleistet werden. Dieses Expertensystem soll besser sein als menschliche Experten und viele Millionen Dollar eingespart haben.
Sammut et al. Entwickelten 1992 einen automatischen Piloten für eine Cessna. Die Beispieldaten wurden durch Beobachtung von drei erfahrenen Piloten im Flugsimulator gewonnen. Jeder der Piloten führte 30 Minuten lang einen vordefinierten Flugplan aus. Jedes Mal wenn ein Pilot eine Steueraktion durchführte indem er eine Steuervariable setzte, z.B. Schub oder Flügelklappen, wurde ein Beispiel erzeugt. Insgesammt wurden 90.000 Beispiele erzeugt, jedes durch 20 Zustandsvariable beschreiben und mit der durchgeführten Aktion markiert. Aus den Beispielen wurde mit Hilfe des Algorithmus ein Entscheidungsbaum erzeugt. Der Baum wurde in ein C-programm umgesetzt und dieses in die Steuerschleife des Flugsimulators integriert, so dass das Programm das Flugzeug selbst fliegen konnte.
Die Ergebnisse waren überraschend. Das Programm konnte nicht nur fliegen, sondern sogar besser fliegen als die menschlichen Lehrer. Der Grund dafür ist, dass beim Lernen gelegentliche Fehler der einzelnen Menschen durch Verallgemeinerung ausgeglichen wurden. Das deutet an, dass für schwierige Aufgaben wie das Fliegen von Hubschraubern, die schwere Lasten bei starkem Wind tragen, mit den Methoden des Maschinellen Lernes Autopiloten entwickelt werden könnten.
Welche Kunden reagieren am wahrscheinlichsten auf eine direkte Mail-Kampagne? Ein Anstieg der response-rate um nur 1% kann zu zusätzlichen Umsätzen von mehreren 100.000 DM führen.
Welche Kunden kaufen das Produkt selten/häufig? Welche Werbeaktion wirkt bei welchen Kunden am besten?
Welche Produkte werden in Zusammenhang mit welchen anderen Produkten gekauft? Diese Erkenntnisse dienen einem besseren Produktprogramm. So sollten bspw. ertragsschwache Produkte nicht aus dem Sortiment gestrichen werden, wenn sie häufig mit ertragsstarken Produkten gekauft werden. Andernfalls würden Kunden abwandern. Andererseits kann die Warenkorbanalyse auch zur besseren räumlichen Plazierung der Produkte im Geschäft verwendet werden. Produkte, die häufig in Kombination gekauft werden, können nebeneinander ausgelegt werden, so daß deren Einkauf erleichtert wird.
Es erweist sich für ein Unternehmen häufig als profitabler, einen alten Kunden zu halten anstatt einen neuen Kunden zu gewinnen. Welche Kunden werden demnächst wahrscheinlich die Bindungen an das Unternehmen haben? (Banken, Versicherungen, Versandhäuser, Telefongesellschaften, Zeitungen, Zeitschriften).
Welche Mitarbeiter werden demnächst das Unternehmen wahrscheinlich verlassen? Das Ausscheiden eines qualifizierten Mitarbeiters verursacht durchschnittlich Kosten in Höhe von 100.000 DM (Kosten für Rekruitierung, Produktivitätsverluste, Einarbeitung, Schulung)
Wie viel und welches Personal muß bspw. in einem Call Center zu unterschiedlichen Tagen/ Tageszeiten eingesetzt werden? Je besser und schneller die Kunden beraten werden, desto höher wird die Kundenzufriedenheit.
Die Vorhersage von schlechten Kreditnehmern kann den Verlust des Kreditgebers um mehrere 100.000 DM mindern. Data Mining hilft bei der Entwicklung neuer Kriterien, die bei der Kreditvergabe berücksichtigt werden können.
Die Verwendung von Kreditkarten/Kundenkarten mit betrügerischer Absicht soll frühzeitig erkannt werden. Data Mining hilft bei der Entwicklung neuer Kriterien, die bei der Kartenvergabe berücksichtigt werden können.
Anrufe bei Call Centern können zur Erkennung von Produktproblemen bei Herstellung und Gestaltung verwendet werden. Anfragen nach bestimmten Leistungen/Produkten lassen Rückschlüsse auf bestimmte Marketingstrategien zu.
Die Auswertung ärtzlicher Behandlungsdaten kann Hinweise auf besonders erfolgreiche Krankheitstherapien offenbaren.
Wie können die Beiträge bei neuen Kunden möglichst individuell eingestellt werden?
Welche touristischen Leistungen werden wann und wo von welchen Personengruppen wahrgenommen?
Cabena Peter Discovering Data Mining ( IBM Technical Supports )
Witten, I.A., FRANK; E. ( 2000 ) Data Mining. Praktikan Maschinen Leraning Tools and Tecniques with JAVA INCLEMANTION. ACADEMIC PRESS, SAN DIEGO, CA )
BRRY, M.J.A., LINOFF, G. (1997), data mining techniques. For marketing, sales, and customer supports. John WILEY & SONS, Inc., New York
Hand, D., Mannila, H., Smyth, P. (2001), Principles of data mining. MIT Press, Cambridge, Mass.
Data Mining (Prof.Dr.Werner Dilger) Berufs Akademie Mannheim