Ein großes Problem bei der Erstellung eines CRM-Systems ist die heterogene Datenflut. Es sammeln sich mit der Zeit diverse Einzellösungen, sogenannte Insellösungen an, die wenn sie sinnvoll sind einer Zusammenführung bedürfen. Der Ort an dem alle Informationen ihren Platz finden ist das Data-Warehouse.
Ein Data-Warehouse ist eine Datenbank, in der Daten aus unterschiedlichen Quellen in einem einheitlichen Format zusammengefasst werden (Informationsintegration). Dadurch verbessert sich der Komfort beim Zugang zu diesen Daten.Die Daten werden von den Datenquellen bereitgestellt und im ETL-Prozess in das Data-Warehouse geladen und dort vor allem für die Datenanalyse und zur betriebswirtschaftlichen Entscheidungshilfe in Unternehmen sowie zum Data-Mining langfristig gespeichert.
Der Erstellung eines Data-Warehouses liegen zwei Leitgedanken zugrunde:
- Integration von Daten aus verteilten und unterschiedlich strukturierten Datenbeständen, um im Data-Warehouse eine globale Sicht auf die Quelldaten und damit übergreifende Auswertungen zu ermöglichen.
- Separation der Daten, die für das operative Geschäft genutzt werden, von solchen Daten, die im Data-Warehouse etwa für Aufgaben des Berichtswesens, der Entscheidungsunterstützung, der Geschäftsanalyse sowie des Controllings und der Unternehmensführung verwendet werden.
Das Data-Warehouse ist die zentrale Komponente eines Data-Warehouse-Systems. Daten werden aus verschiedenen Quellen extrahiert, durch Transformation bereinigt und vereinheitlicht, um danach in das Data-Warehouse geladen zu werden. Dieser Prozess kann turnusgemäß durchgeführt werden, so dass im Data-Warehouse nicht nur Daten nach inhaltlichen Aspekten, sondern auch nach dem Aspekt Zeit – also langfristig – vorgehalten werden, was auch Analysen über die Zeit ermöglicht.