Entrepôt de données et analyse de données

Votre vote

L’évolution technologique permet d’envisager des analyses de plus en plus complexes de données nécessitant des ressources informatiques de plus en plus puissantes. Une architecture populaire, en particulier dans les grandes entreprises, consiste à organiser les données en deux catégories de bases de données complémentaires : les bases de données opérationnelles et l’entrepôt de données.

Entrepôt de données et bases de données opérationnelles

Entrepôt de données
format PDF 9.00$ 

Entrepôt de données (data warehouse) et analyse de données en ligne (On Line Analytical Processing – OLAP) L’entrepôt de données est une base de données constituée d’un grand volume de données historiques extraites de bases opérationnelles et possiblement de sources externes. Il est destiné à l’analyse de données en ligne pour le support à la prise de décision.

Entrepôt de données et analyse de données

Les analyses de données sont effectuées à partir de l’entrepôt de données. Pour supporter un niveau de performance acceptable sur des volumes importants de données, un entrepôt de données exploite souvent une architecture de base de données parallèle et des méthodes d’organisation de données particulières (schéma en étoile, vue matérialisée, index bitmap, index de jointure, etc.).

Les différentes techniques d’analyse de données peuvent être combinées de manière à former une chaîne de traitement complexe. Les prochaines sections présentent les principaux concepts des entrepôts de données, de l’analyse des données OLAP et de la fouille de données.

Entrepôt de données et Oracle Warehouse builder

L’outil Oracle Warehouse Builder est un exemple d’outil ETL qui permet d’alimenter un entrepôt de données en combinant divers traitements d’extraction, fusion, transformation à partir de sources de données hétérogènes. L’outil permet de spécifier les rôles joués par les tables et leurs colonnes (faits, dimensions, niveau hiérarchique). Ces schémas sont ensuite utilisés par les outils OLAP. Des extensions SQL ont été incorporées pour la définition des schémas d’entrepôts de données (par exemple CREATE DIMENSION).

Ainsi, un entrepôt de données d’entreprise couvre un ensemble de sujets pertinents globalement. Un magasin de données (data mart) désigne alors un entrepôt de données de portée limitée, par exemple à un département d’une organisation.

Table des matières – Entrepôt de données

  • 19.1 Schéma en étoile pour le OLAP 1003
  • 19.2 Regroupements multidimensionnels (CUBE et ROLLUP SQL:1999) 1006
  • 19.3 Statistiques d’ordonnancement 1012
  • 19.4 Regroupements par fenêtrage 1014
  • 19.5 Implémentation OLAP 1018
  • 19.6 Fouille de données 1020
  • 19.7 Règles d’association 1021
  • Algorithmes d’extraction des itemsets fréquents 1024
  • Génération des règles à partir des itemsets fréquents 1029
  • Bases pour les règles d’association exactes 1031
  • Itemset fermé et treillis de concepts 1031
  • La base de Duquenne-Guigues 1035
  • Base générique pour règles d’association exactes 1036
  • Extraction des itemsets fermés fréquents 1038
  • Algorithme Close de génération des itemsets fermés fréquents avec leurs générateurs 1039
  • Algorithme Aclose de génération des fermés fréquents avec leurs générateurs 1042
  • Bases pour les règles approximatives 1044
  • Arbre digital de patrons féquents 1048
  • 19.8 Algorithmes de regroupement 1058
  • Regroupement ascendant hiérarchique 1059
  • Partitionnement descendant 1062
  • 19.9 Classification 1064
  • Classification bayésienne 1064
  • Arbre de décision 1066
  • Réseau de neurones artificiels supervisé 1070
  • Notes bibliographiques 1072
  • Références 1075

l’Éditeur