Vienna! See! See!     [www.vienna.cc]   [English / Deutsch / Po-Russky]   [Search/Suchen]

www.vienna.cc - Company Logo

Hotel ONLINE
English / Italiano / Deutsch
Español / Français
日本語 / 中文
Online Travel Agency - Click here

ViennaCC-Music online
 

Google


Deutsch
Suchen in:

Suchbegriffe:

AMAZON.DE
Unsere Empfehlungen

English

Search:

Keywords:

AMAZON.COM
Our Recommendations
Shopping:
Deutsch
English
Po-Russky

Data Warehouse (DWH)

Informations-Supermarkt oder Daten-Müllhalde

Begriffsklärung

Unter DWH ist die Gesamtheit von Prozessen, die durch verschiedene Technologien und Diensten unterstützt werden und dabei

  • Daten aus verschiedenen Anwendungssystemen übernehmen
  • diese Daten in einem logischen Modell integrieren
  • so speichern, daß sie für den Endbenutzer zugänglich und verständlich sind
  • und auf breiter Basis für Auswertungen zur Verfügung stellt

Ich möchte die sehr wissenschaftliche Erklärung an Hand eines Beispiels näher erläutern: Aus verschiedenen Datenbanken, z.B. Kunden und Immobilien, werden Daten extrahiert und in einer Abfragedatenbank so gespeichert, daß diese Daten miteinander verknüpft werden können. Nun könnten Kunden nach Region und Zahlungskraft klassifiziert werden und das Immobilienangebot sowie spezielle Marketingmaßnahmen darauf abgestimmt werden. Als Nutzen ergibt sich verbesserte Zielgruppenorientierung und eine Reduktion von Streuverlusten der Werbung. Das Kopieren von Daten in ein eigenes Datensystem ist deshalb notwendig, weil die operativen Anwendungen durch aufwendige Abfragen belastet würden, operative Datenbestände nicht immer für Abfragen dieser Art sondern eben für den operativen Betrieb optimiert sind und nicht immer über eine ausreichende Historie verfügen sowie inkonsistent sein können.

Nutzen eines DWH

Ein dispositives Informationssystem soll analytische und planerische Managementaufgaben unterstützen, vor allem Entscheidungsgrundlagen liefern. Die raschere Verfügbarkeit von Information sollte zu höhrer Produktivität und/oder rascheren Reaktionszeiten führen. Bessere Kenntnis des Kundenverhaltens kann positive Effekte auf Produktion von Waren, Leistung von Diensten oder verkaufsunterstützende Maßnahmen und damit den Absatz bewirken. Demgegenüber ist das operative Informationssystem für die Unterstützung der Geschäftsprozesse ausgelegt.

Beispiele

Dem obigen Beispiel folgend könnten folgende Anfragen an das DWH gerichtet werden: Wieviele Kunden kaufen Häuser bis 130m2? oder Wieviele Häuser kaufen Kunden in Wien/Floridsdorf? Man könnte diese beiden Fragestellungen in einer Matrix darstellen, welche auf einer Achse die Kunden nach Region und auf der anderen Achse die Hausgröße enthält. Ein DWH kann natürlich mehr als 2 Dimensionen verarbeiten! So könnten beispielsweise die Kundengruppe der Besserverdiener und pünktlichen Zahler betrachtet werden. Häuser können ebenfalls in Einfamilienhaus, Bungalow und Reihenhaus eingeteilt werden. Man sollte sich die Daten nun als mehrdimensionalen Würfel vorstellen, man spricht vom "magischen Würfel".

Aus diesem Würfel können einzelne Ebenen nach verschiedenen Blickwinkeln herausgeschnitten werden. Beispiele: Welche Besserverdiener kaufen Bungalows? Welche Regionen werden von Reihenhaus-Interessenten bevorzugt? Natürlich können Daten auch summiert werden, wie etwa: Verkaufen wir mehr Bungalows oder Reihenhäuser? Man spricht vom Slicing (schneiden) und Dicing (dice=Würfel).

Doch das ist längst nicht alles! Hier erst beginnt die kreative Arbeit des "Datenschürfers", der wie in einer Mine nach interessanten Zusammenhängen sucht - man spricht von Datamining. Der Kreativität sind keine (nur technische) Grenzen gesetzt. Es könnte folgender Zusammenhang erkennbar werden: Besserverdiener kaufen schlüsselfertige Einfamilienhäuser inklusive Baugrund am Stadtrand mit Keller und Garage, Jungvermählte möchten auf vorhandenem Baugrund Einfamilienhäuser ohne Garage bestellen und selbst (mit)bauen. Paket-Angebote könnten darauf abgestimmt werden. Ein weiteres Muster könnte Auskunft über Zahlungsmoral geben, etwa: Fremdfinanzierte Häuser mit Förderung werden pünktlich bezahlt, Eigenmittelfinanzierungen sind problematisch. Dies könnte Einfluß auf Verkaufsverhandlungen haben. Dabei kann man natürlich auch auf merkwürdige Zusammenhänge stoßen: Beispiel: Besteht eine Relation zwischen Geschlecht und Auftragsmonat? Etwa: Bestellen alleinstehende Männer unter 30 im Oktober eher eine Veranda als verwitwete Frauen über 50?

Unglaublich? Nein! Der Handel hat längst das Verkaufsverhalten seiner Kunden untersucht und kann mit speziellen Angeboten auf die Vorlieben der Einkäufer reagieren. Als Ford untersuchte, wer in einer Ehe die Kaufentscheidung über Autos trifft, wurde transparent, daß Ehefrauen den Ausschlag geben. Ford, bislang nur in Männermagazinen präsent, startete eine Werbeoffensive in Frauenzeitschriften und Hausfrauensendungen im TV.

Auch im Supermarkt werden Zielgruppen-orientierte Angebote erstellt. Die Kassiererin drückt vom Kunden unbemerkt eine Taste M(ann) oder F(rau) und hält somit das Geschlecht des Kunden fest. Bei Untersuchung der Daten stellte sich z.B. heraus, daß Männer, welche Samstag abends Bier kaufen, auch Knabbergebäck mitnehmen. Was lag näher als Bier und Erdnüsse im Kombipack anzubieten?

Big brother is watching You; er kennt nicht Deinen Namen, aber er weiß: Wenn Du, männlich, samstags Bier kaufst, nimmst Du wahrscheinlich Erdnüsse dazu. Anderes Beispiel: Supermarkt-Käufer kaufen meist Wurst oder Fleisch. Daher ist die Fleischabteilung meist ganz hinten, damit der Kunde an verlockenden Angeboten vorbeigelotst wird und möglicherweise mehr kauft als geplant.

Realisierung

Der Nutzen eines DWH hängt vor allem von dessen Abstimmung auf die Bedürfnisse der Anwender ab. Daher ist ein DWH-Projekt kein reines EDV-Projekt, sondern eine betriebswirtschaftliche und vielleicht sogar eine psychologische Aufgabe. Das Hauptaugenmerk eines DWH liegt auf den Daten. Der Anwender muß über deren Bedeutung und Herkunft Bescheid wissen. Er muß reproduzierbare Ergebnisse auf einfache Weise erzeugen und dokumentieren können. Ein Muster-DWH gibt es natürlich nicht, individuelle Lösungen sind zu erarbeiten.

Betrachtung der Daten

Die Analyse von Unternehmensdaten kann in einem sog. Datenraum erfolgen. Dieser enthält im Wesentlichen Stammdaten. Die Daten werden meist gemäß dem Entity-Relationship-Modell in relationalen Datenbankstruktur unter Verwendung von Schlüsseln (künstliche oder natürliche) abgebildet. Durchschnitts- und Summenbildung bedingen meist ein vollständiges Durchsuchen von Tabellen (Table-Scan) sowie die Verknüpfung mit anderen Tabellen (Joining). Beispiel: Welchen Preis hat der Bungalow 22B/3?

Im mulitdimensionalen Raum können Daten aus verschiedenen Datenquellen verknüpft werden, Einzelwerte sind bereits aggregiert. Hierbei werden die Daten über hierarchische Dimensionen definiert, wie etwa Zeitraum, Produkte, Regionen. Diese Dimensionen können in einer Stufenordnung gegliedert sein, etwa Regionen nach Bundesland, Gebiet, Gemeinde. Die Betrachtung erfolgt nach verschiedenen Bewertungen (wie etwa Produktgruppe, Auftragswert), in unterschiedlichen Ebenen und unter Verwendung von statistischen Analysefunktionen. Beispiel: Wieviele Reihenhäuser wurden im ersten Halbjahr 1999 in Wien-Nord verkauft?

Der Varianzraum gibt Aufschluß über Abweichungen in einer bestimmten Dimension. Als typisches Beispiel können vergleichende Zeitreihen genannt werden, wie etwa den Grad der &Juml;nderung von Umsätzen über einen Zeitraum. Mit sogenannten Candle Stick Charts werden beispielsweise &Juml;nderungen von Aktienkursen dargestellt.

Sehr interessant ist der Raum der Einflußgrößen, wo der Einfluß von Merkmalsausprägungen auf bestimmte Größen untersucht wird. Beispiel: Welchen Einfluß hat das Anbieten von Gartengestaltung auf den Umsatz von Häusern? Hier ist Platz für das erwähnte Datamining, das Auffinden von unbekannten Informationsmustern (Knowledge Discovery) oder Hypothesentest. Moderne Tools können sogar das Auffinden von Hypothesen ermöglichen. Vorsicht ist geboten, da Datenbestände unvollständig oder fehlerhaft sein können. Statistische Ausreißer und die Dynamik von Daten (z.B. großes Wachstum) sind ebenfalls Stolpersteine. Außerdem sind Attribute auf ihre Relevanz zu untersuchen - oder sollte man tatsächlich von der Zehennagelform auf Musikalität schließen können?

Wie kommen Daten ins DWH

Aus den operativen Systemen werden relevante Daten extrahiert und unter Umständen aggregiert. In einem Nachbearbeitungsschritt werden die Daten DWH-gerecht aufbereitet. So müssen zum Beispiel &Juml;nderungen nachvollzogen werden, damit Zeitreihen weiter möglich sind. Werden Historien geführt, muß bei &Juml;nderungen ein neuer Datensatz erzeugt werden, Verknüpfungen sind entsprechend zu aktualisieren. Als nächstes erfolgt der Transport der Daten vom Quell- zum Zielsystem. Dies kann eine durchaus anspruchsvolle Aufgabe sein, wenn große Datenmengen über ein Netzwerk transportiert werden sollen. Danach erfolgt das Laden der Daten und eine Reorganisation, Indizierung und Sicherung der Datenbanken. Nicht zu unterschätzender Aufwand fällt für Qualitätssicherung an mit Checks auf Vollständigkeit, Konsistenz und Plausibilität.

Werkzeuge

Einfaches Navigieren, Abfragen, Zugreifen, Kombinieren, Analysieren, Aufbereiten und Präsentieren ist gefordert. Komfortabel und intuitiv soll die Bedienung sein, wobei die Anforderungen je nach Benutzergruppe sehr unterschiedlich sind. Führungsverantwortliche benötigen die sogenannte "Information at my fingertips" (Entscheidungsträgerinformationssystem). Ein Klick und eine Ampel zeigt rot, gelb oder grün. Die Information muß leicht zugänglich und extrem verdichtet sein. Datamining-Schürfer wiederum benötigen einen breiten Funktionsumfang mit großem Gestaltungsraum für eigene Kreativität.

Es gibt eine Reihe von Anbietern von DWH-Lösungen wie etwa SAS oder Platinum. Aber auch mit Werkzeugen einer nicht näher bezeichneten Software-Firma, sowie interessanter Add-Ins dazu, können Tore (Gates) und Fenster in die Datenwelt eröffnet werden. Und der Markt ist groß! Glaubt man der Studie "A study of the Financial Impact of Data Warehousing" der kanadischen International Data Corporation (IDC) liegen die durchschnittlichen Kosten eines DWH bei 2,2 mio USD bei einer Amortisation von 2,3 Jahren. Der durchschnittliche ROI (Return on investment) wird mit 401% binnen 3 Jahren angegeben.

Weiterführende Links

http://idc.ca/ (International Data Corporation)
http://dw-institute.com/
http://pwp.starnetinc.com/larryg/index.html



Zurück zur Übersicht