Le but de la conférence

Après avoir étudié le matériel de cette conférence, vous saurez:

quelle modèle de données d'entreprise ;
comment convertir modèle de données d'entreprise dans le modèle d'entrepôt de données;
éléments principaux modèle de données d'entreprise ;
couches de présentation du modèle de données d'entreprise ;
un algorithme pour transformer un modèle de données d'entreprise en un modèle d'entrepôt de données multidimensionnel ;

et apprenez à:

développer des modèles d'entrepôt de données basés sur modèle de données d'entreprise les organisations;
concevoir un schéma en étoile à l'aide des outils CASE;
tables de partition modèle multidimensionnel en utilisant les outils CASE.

Modèle de données d'entreprise

introduction

Le cœur de tout HD est son modèle de données. Sans un modèle de données, il sera très difficile d'organiser les données en HD. Par conséquent, les développeurs HD devraient consacrer du temps et des efforts à développer un tel modèle. Le développement du modèle HD tombe sur les épaules du designer HD.

Par rapport à la conception des systèmes OLTP, la méthodologie de conception du CD présente un certain nombre de caractéristiques distinctives associées à l'orientation des structures de données de stockage pour résoudre les problèmes d'analyse et de support d'information du processus de prise de décision. Le modèle de données HD devrait fournir une solution efficace à ces problèmes précisément.

Le point de départ de la conception d'un CD peut être le soi-disant modèle de données d'entreprise (modèle de données d'entreprise ou modèle de données d'entreprise, EDM), qui est créé lors du processus de conception des systèmes OLTP d'une organisation. Lors de la conception modèle de données d'entreprise on essaie généralement de créer une structure de données basée sur des opérations commerciales qui collecterait et synthétiserait tous les besoins d'information de l'organisation.

Donc, modèle de données d'entreprise contient les informations nécessaires pour créer un modèle de CD. Par conséquent, à la première étape, si un tel modèle existe dans l'organisation, le concepteur HD peut démarrer la conception HD en résolvant le problème de transformation modèle de données d'entreprise dans le modèle HD.

Modèle de données d'entreprise

Comment résoudre le problème de la transformation modèle de données d'entreprise dans le modèle HD? Pour résoudre ce problème, vous devez avoir ce modèle, c'est-à-dire modèle de données d'entreprise devrait être construit et documenté... Et tu as besoin de comprendre quelle à partir de ce modèle et comme devrait se transformer en modèle HD.

Clarifions du point de vue d'un concepteur de CD le concept modèle de données d'entreprise. Sous modèle de données d'entreprise comprendre la description stratifiée et structurée des domaines d'une organisation, des structures de données de domaine, des processus métier et des procédures commerciales, des flux de données organisationnels, des diagrammes d'état, des matrices de processus de données et d'autres représentations de modèles utilisées dans les activités de l'organisation. Ainsi, au sens large du mot, modèle de données d'entreprise est un ensemble de modèles de différents niveaux qui caractérisent (modélisent à un certain niveau abstrait) les activités d'une organisation, i.e. contenu modèle d'entreprise dépend directement des constructions modèles qui y ont été incluses dans une organisation donnée.

Les principaux éléments modèle de données d'entreprise sont:

description des domaines thématiques de l'organisation (définition des domaines d'activité);
les relations entre les domaines définis ci-dessus;
modèle de données d'information (modèle ERD ou modèle "entité-relation");
description pour chaque domaine:
- clés d'entité;
- attributs d'entité;
- sous-types et supertypes;
- relations entre entités;
- attributs de regroupement;
- relations entre les domaines;
modèle de processus fonctionnel ou commercial;
diagrammes de flux de données;
diagrammes d'état;
d'autres modèles.

Donc, modèle de données d'entreprise contient des entités, des attributs et des relations qui représentent les besoins d'information d'une organisation. En figue. 16.1 montre les principaux éléments modèle de données d'entreprise.

Niveaux de présentation du modèle de données d'entreprise

Modèle de données d'entreprise subdivisé selon les domaines, qui représentent des groupes d'entités pertinentes pour répondre à des besoins commerciaux spécifiques. Certains domaines peuvent couvrir des fonctions commerciales spécifiques telles que la gestion des contrats, tandis que d'autres peuvent inclure des entités qui décrivent des produits ou des services.

Chaque modèle logique doit correspondre au domaine existant modèle de données d'entreprise... Si le modèle logique ne répond pas à cette exigence, un modèle de domaine doit y être ajouté.

Modèle de données d'entreprise a généralement plusieurs niveaux de présentation. En réalité haut niveau (haut niveau) modèle de données d'entreprise il y a une description des principaux domaines thématiques de l'organisation et de leurs relations au niveau de l'entité. En figue. 16.2 est un extrait modèle de données d'entreprise haut niveau.

Figure: 16.2.

Le diagramme illustré dans la figure représente quatre domaines: "Acheteur" ( Client), "But" ( compte), "Ordre" ( Ordre) et "Produit" ( Produit). En règle générale, au niveau supérieur de la vue du modèle, uniquement connexions directes entre les domaines, qui, par exemple, enregistrent le fait suivant: l'acheteur paie la facture pour la commande de marchandises. Détails et relations indirectes à ce niveau modèle d'entreprise pas montré.

Sur le suivant, niveau moyen (niveau moyen) modèle de données d'entreprise des informations détaillées sur les objets des domaines sont affichées, c'est-à-dire les touches et attributs d'entité, leurs relations, sous-types et supertypes, etc. Pour chaque domaine du modèle de niveau supérieur, il existe un modèle de niveau intermédiaire. En figue. 16.3 montre le niveau intermédiaire de présentation modèle d'entreprise pour un fragment du domaine "Commande".

Figure. 16.3 on peut voir que le domaine "Commande" ( Ordre) comprend plusieurs entités, définies par leurs attributs et les relations entre elles. Le modèle présenté vous permet de répondre à des questions telles que la date de la commande, qui a passé la commande, qui a envoyé la commande, qui reçoit la commande et un certain nombre d'autres. À partir du diagramme ci-dessus, on peut voir que dans cette organisation, il existe deux types de commandes - les commandes pour une promotion ( Commercial) et les commandes au détail ( Vente au détail).

remarquerez que modèle de données d'entreprise peut représenter divers aspects des activités de l'organisation et avec divers degrés de détail et d'exhaustivité. Si un modèle d'entreprise représente tous les aspects des activités de l'organisation, il est également appelé modèle de données d'organisation (modèle de données d'entreprise).

Du point de vue de la conception HD, un facteur important dans la décision de créer un modèle HD à partir de modèle de données d'entreprise est l'état exhaustivité modèle de données d'entreprise.

Modèle de données d'entreprise l'organisation a les caractéristiques de l'évolution, c'est-à-dire il se développe et s’améliore constamment. Certains domaines modèle de données d'entreprise peut être bien développé, pour certains, le travail n'a peut-être pas encore commencé. Si un fragment du domaine n'a pas été élaboré en modèle de données d'entreprise, alors il n'y a aucun moyen d'utiliser ce modèle comme point de départ pour concevoir un CD.

Diplôme d'achèvement modèle d'entreprise peut être nivelé dans la conception du CD comme suit. Étant donné que le processus de développement de CD est généralement divisé dans le temps en une séquence d'étapes, le processus de sa conception peut être synchronisé avec processus d'achèvement développer des fragments séparés modèle de données d'entreprise organisations.

Au plus bas couche de présentation du modèle de données d'entreprise des informations sur les caractéristiques physiques des objets de la base de données correspondant à modèle de données logique milieu couche de présentation du modèle de données d'entreprise.

La base de données d'entreprise est le lien central du système d'information de l'entreprise et vous permet de créer un espace d'information unique pour l'entreprise. Bases de données d'entreprise

Partagez votre travail sur les réseaux sociaux

Si ce travail ne vous convenait pas en bas de page il y a une liste d'œuvres similaires. Vous pouvez également utiliser le bouton de recherche

PAGE 15

THÈME V. BASES DE DONNÉES D'ENTREPRISE

CONFÉRENCE 8

V .1. Organisation des données dans les systèmes d'entreprise. Bases de données d'entreprise.

V .2. SGBD et solutions structurelles dans les systèmes d'entreprise.

V .3. Technologies Internet / Intranet et des solutions d'entreprise pour l'accès aux bases de données.

V .1. ORGANISATION DES DONNÉES DANS DES SYSTÈMES D'ENTREPRISE. BASES DE DONNÉES D'ENTREPRISE

Base corporative les données constituent le lien central du système d'information de l'entreprise et vous permettent de créer un espace d'information unique pour l'entreprise. Bases de données d'entreprise (Figure 1.1).

Il existe différentes définitions des bases de données.

Sous la base de données (DB) comprendre un ensemble d'informations liées logiquement de manière à constituer un ensemble unique de données stockées dans les dispositifs de mémoire d'un ordinateur. Cet ensemble agit comme les données initiales des problèmes résolus dans le processus de fonctionnement des systèmes de contrôle automatisés, des systèmes de traitement de données, des systèmes d'information et de calcul.

Le terme base de données peut être résumé comme un ensemble de données logiquement liées destinées à être partagées.

Sous la base de données s'entend comme un ensemble de données stockées conjointement avec une telle redondance minimale permettant leur utilisation de manière optimale pour une ou plusieurs applications.

Le but de la création de bases de données comme formes de stockage de données construction d'un système de données qui ne dépend pas des algorithmes adoptés (logiciels), des moyens techniques utilisés, de la localisation physique des données dans l'ordinateur. La base de données suppose une utilisation polyvalente (plusieurs utilisateurs, de nombreuses formes de documents et demandes d'un seul utilisateur).

Exigences de base pour les bases de données:

Exhaustivité de la présentation des données. Les données de la base de données doivent représenter de manière adéquate toutes les informations sur l'objet et doivent être suffisantes pour les SAO.
Intégrité de la base de données. Les données doivent être sauvegardées lors du traitement de leur SAO et dans toutes les situations survenant pendant les travaux.
Flexibilité de la structure des données. La base de données doit permettre de modifier les structures de données sans violer son intégrité et son exhaustivité lorsque les conditions externes changent.
Faisabilité. Cela signifie qu'il doit y avoir une représentation objective des différents objets, de leurs propriétés et de leurs relations.
Disponibilité. Il est nécessaire d'assurer la différenciation de l'accès aux données.
Redondance. La base de données doit avoir une redondance minimale de la représentation des données sur tout objet.

La connaissance signifie un ensemble de faits, de modèles et de règles heuristiques avec lesquels vous pouvez résoudre le problème.

Base de connaissances (Ko)  un ensemble de bases de données et de règles utilisées obtenues auprès des décideurs. La base de connaissances est un élément des systèmes experts.

Distinguerdifférentes manières de présenter les données.

Données physiques -ce sont des données stockées dans la mémoire de l'ordinateur.

Représentation logique des donnéescorrespond à une vue personnalisée des données physiques. La différence entre les représentations physiques et logiques correspondantes des données est que cette dernière reflète certaines relations importantes entre les données physiques.

Sous la base de données d'entreprise comprendre une base de données qui rassemble sous une forme ou une autre toutes les données et connaissances nécessaires sur l'organisation en cours d'automatisation. Dans les systèmes d'information d'entreprise, un concept tel quebases de données intégrées, dans lequel le principe de la saisie unique et de l'utilisation répétée des informations est mis en œuvre.

Figure: 1.1. La structure de l'interaction des départements avec les ressources informationnelles de l'entreprise.

Les bases de données d'entreprise sontconcentré (centralisé) et distribué.

Focalisé (centralisé)base de données est une base de données dont les données sont physiquement stockées dans les périphériques de stockage d'un ordinateur. En figue. 1.2 présente un schéma d'une application serveur pour accéder aux bases de données sur différentes plates-formes.

Graphique 1.2. Schéma hétérogène base de données centralisée

La centralisation du traitement de l’information a permis d’éliminer les inconvénients des systèmes de fichiers traditionnels tels que l’incohérence, l’incohérence et la redondance des données. Cependant, à mesure que les bases de données se développent, et en particulier lorsqu'elles sont utilisées dans des organisations géographiquement dispersées, des problèmes surviennent. Par exemple, pour des bases de données concentrées situées au nœud d'un réseau de télécommunication, à l'aide desquelles divers services de l'organisation ont accès aux données, avec la croissance du volume d'informations et du nombre de transactions, les difficultés suivantes se posent:

Grand flux d'échange de données;
Trafic élevé sur le réseau;
Faible fiabilité;
Mauvaise performance globale.

S'il est plus facile d'assurer la sécurité, l'intégrité et la cohérence des informations lors des mises à jour dans une base de données concentrée, ces problèmes posent certaines difficultés. La décentralisation des données est proposée comme solution possible à ces problèmes. La décentralisation permet:

Plus haut degré de simultanéité du traitement grâce à l'équilibrage de charge;
Amélioration de l'utilisation des données sur le terrain lors de l'exécution de requêtes distantes (distantes);
Réduction des coûts;
Facilité de gestion des bases de données locales.

Les coûts de création d'un réseau, dans les nœuds desquels se trouvent les postes de travail (petits ordinateurs), sont bien inférieurs aux coûts de création d'un système similaire à l'aide d'un gros ordinateur. La figure 1.3 montre le schéma logique d'une base de données distribuée.

Graphique 1.3. Base de données distribuée des sociétés.

Donnons la définition suivante d'une base de données distribuée.

Base de données distribuée -il s'agit d'un ensemble d'informations, de fichiers (relations) stockés dans différents nœuds du réseau d'information et connectés logiquement de manière à constituer un seul ensemble de données (la connexion peut être fonctionnelle ou à travers des copies du même fichier). Il s'agit donc d'un ensemble de bases de données logiquement interconnectées, mais physiquement situées sur plusieurs machines faisant partie d'un même réseau informatique.

Les exigences de performances les plus importantes pour une base de données distribuée sont:

Évolutivité;
Compatibilité;
Prise en charge de divers modèles de données;
Portabilité;
Transparence de l'emplacement;
Autonomie des nœuds de base de données distribués (Autonomie du site);
Traitement des demandes distribué;
Exécution de transactions distribuées.
Prise en charge d'un système de sécurité homogène.

La transparence de l'emplacement permet aux utilisateurs d'interagir avec les bases de données sans rien savoir de leur emplacement. L'autonomie des nœuds dans une base de données distribuée signifie que chaque base de données peut être maintenue indépendamment des autres. Une requête distribuée est une requête (instruction SQL), lors de l'exécution de laquelle on accède aux objets (tables ou vues) de différentes bases de données. Lors de l'exécution de transactions distribuées, un contrôle d'accès concurrentiel de toutes les bases de données impliquées est effectué. Oracle7 utilise une technologie de transfert d'informations en deux phases pour effectuer des transactions distribuées.

Les bases de données qui constituent une base de données distribuée ne doivent pas être homogènes (c'est-à-dire maintenues par un SGBD) ou traitées dans l'environnement du même système d'exploitation et / ou sur des ordinateurs du même type. Par exemple, une base de données peut être une base de données Oracle sur une machine SUN exécutant SUN OS (UNIX), une deuxième base de données peut être hébergée par une base de données DB2 sur un mainframe IBM 3090 avec un système d'exploitation MVS et une troisième base de données peut être exécutée par SQL / DS également sur le mainframe IBM, mais avec le système d'exploitation VM. Une seule condition est requise: toutes les machines dotées de bases de données doivent être accessibles sur le réseau dont elles font partie.

La tâche principale d'une base de données distribuée - distribution des données sur le réseau et accès à celui-ci. Il existe les moyens suivants pour résoudre ce problème:

Chaque nœud stocke et utilise son propre ensemble de données disponible pour les requêtes distantes. Cette distribution est divisée.
Certaines données fréquemment utilisées sur des sites distants peuvent être dupliquées. Cette distribution est appelée partiellement dupliquée.
Toutes les données sont dupliquées à chaque nœud. Cette distribution est appelée entièrement dupliquée.
Certains fichiers peuvent être fractionnés horizontalement (un sous-ensemble d'enregistrements est sélectionné) ou verticalement (un sous-ensemble de champs d'attribut est sélectionné), tandis que les sous-ensembles sélectionnés sont stockés dans différents nœuds avec des données non fractionnées. Cette distribution est appelée split (fragmenté).

Lors de la création d'une base de données distribuée au niveau conceptuel, vous devez résoudre les tâches suivantes:

Il est nécessaire d'avoir un seul schéma conceptuel de l'ensemble du réseau. Cela fournira une transparence logique des données à l'utilisateur, à la suite de quoi il pourra former une requête à l'ensemble de la base de données, se trouvant derrière un terminal séparé (il semble fonctionner avec une base de données centralisée).
Un schéma est nécessaire pour localiser les données sur le réseau. Cela assurera la transparence du placement des données, grâce à laquelle l'utilisateur ne peut pas spécifier où envoyer la demande pour obtenir les données requises.
Il est nécessaire de résoudre le problème de l'hétérogénéité des bases de données distribuées. Les bases de données distribuées peuvent être homogènes ou hétérogènes en termes de matériel et de logiciel. Le problème de l'hétérogénéité est relativement facile à résoudre si la base de données distribuée est hétérogène au sens matériel, mais homogène au sens logiciel (le même SGBD dans les nœuds). Si différents SGBD sont utilisés dans les nœuds d'un système distribué, des outils de conversion de structures de données et de langages sont nécessaires. Cela devrait assurer la transparence de la transformation entre les nœuds de la base de données distribuée.
Le problème de la gestion des dictionnaires doit être résolu. Pour offrir toutes sortes de transparence dans une base de données distribuée, vous avez besoin de programmes qui gèrent plusieurs dictionnaires et ouvrages de référence.
Vous devez définir des méthodes pour exécuter des requêtes dans une base de données distribuée. Les méthodes d'exécution des requêtes dans une base de données distribuée diffèrent de celles d'une base de données centralisée, car des parties individuelles des requêtes doivent être exécutées à l'emplacement des données correspondantes et des résultats partiels doivent être transmis à d'autres nœuds; en même temps, la coordination de tous les processus doit être assurée.
Vous devez résoudre le problème de l'exécution de requêtes parallèles. Dans une base de données distribuée, un mécanisme complexe de contrôle de la concurrence est nécessaire, qui, en particulier, doit assurer la synchronisation lorsque les informations sont mises à jour, ce qui garantit la cohérence des données.
Une méthodologie développée pour la distribution et le placement des données est nécessaire, y compris le fractionnement, est l'une des principales exigences pour une base de données distribuée.

L'un des nouveaux domaines de l'architecture des systèmes informatiques en développement actif, qui est un outil puissant pour le traitement de l'information non numérique, sontmachines de base de données... Les machines de base de données sont utilisées pour résoudre des tâches non numériques telles que le stockage, la recherche et la transformation de documents et de faits, et l'utilisation d'objets. Suite à la définition des données en tant qu'informations numériques et graphiques sur les objets du monde environnant, différents contenus sont intégrés dans le concept de données en traitement numérique et non numérique. Le traitement numérique utilise des objets tels que des variables, des vecteurs, des matrices, des tableaux multidimensionnels, des constantes, etc., tandis que le traitement non numérique utilise des objets tels que des fichiers, des enregistrements, des champs, des hiérarchies, des réseaux, des relations, etc. le traitement non numérique s'intéresse directement aux informations sur les objets (par exemple, un salarié spécifique ou un groupe de salariés), et non au fichier des salariés en tant que tel. Le fichier des employés n'est pas indexé ici pour sélectionner une personne en particulier; ici le contenu de l'entrée souhaitée est plus intéressant. De grandes quantités d'informations sont généralement soumises à un traitement non numérique. Dans diverses applications, vous pouvez effectuer, par exemple, les opérations suivantes sur ces données:

augmenter le salaire de tous les employés de l'entreprise;
calculer les intérêts bancaires sur les comptes de tous les clients;
apporter des modifications à la liste de toutes les marchandises en stock;
trouver le résumé requis de tous les textes stockés dans la bibliothèque ou dans le système de recherche d'informations bibliographiques;
trouver une description du contrat requis dans un dossier contenant des documents juridiques;
parcourir tous les fichiers contenant des descriptions de brevets et trouver à nouveau un brevet (le cas échéant) similaire à celui proposé.

Pour implémenter le moteur de base de données,parallèle et associatif architecture comme alternative au mono-processeurvon Neumann structure, permettant de travailler avec de grandes quantités d'informations en temps réel.

Les machines de base de données gagnent en importance dans le cadre de la recherche et de l'application de concepts d'intelligence artificielle tels que la représentation des connaissances, les systèmes experts, l'inférence, la reconnaissance de formes, etc.

Stockages d'informations. Aujourd'hui, beaucoup admettent que déjà aujourd'hui, la plupart des entreprises exploitent plusieurs bases de données et, pour travailler avec succès avec l'information, non seulement différents types de bases de données sont nécessaires, mais différentes générations de SGBD. Selon les statistiques, chaque organisation utilise en moyenne 2,5 SGBD différents. Il est devenu évident qu'il fallait «isoler» l'activité des entreprises, ou plutôt les personnes impliquées dans cette activité, des caractéristiques technologiques des bases de données, pour offrir aux utilisateurs une vue unique des informations de l'entreprise quel que soit l'endroit où elles sont physiquement stockées. Cela a stimulé l'émergence de la technologie de stockage de l'information (Entreposage de données, DW).

L'objectif principal de DW estcréation d'une présentation logique unique des données contenues dans différents types de bases de données ou, en d'autres termes, d'un modèle de données d'entreprise unique.

Un nouveau cycle de développement DW est devenu possible grâce à l'amélioration des technologies de l'information en général, en particulier, l'émergence de nouveaux types de bases de données basés sur le traitement de requêtes en parallèle, qui à son tour reposait sur les progrès des ordinateurs parallèles. Ont été créésgénérateurs de requêtes avec une interface graphique intuitive, qui a facilité la création de requêtes de base de données complexes. Divers logicielscouche intermédiaire (midleware) communication fournieentre différents types de bases de données, et finalement est tombé brusquementpériphériques de stockage.

La structure de la société peut contenir base de données.

Base de données - composante fonctionnelle et organisationnelle des systèmes de contrôle automatisés et des systèmes d'information et de calcul, fournissant un support d'information centralisé pour une équipe d'utilisateurs ou un ensemble de tâches résolues dans le système.

Base de données est considéré comme un système d'information et de référence dont l'objectif principal est:

dans l'accumulation et le maintien en état de fonctionnement d'un ensemble d'informations qui constitue la base d'informations de l'ensemble du système automatisé ou d'un certain ensemble de tâches qui y sont résolues;
dans l'émission des données requises par la tâche ou l'utilisateur;
en fournissant un accès collectif aux informations stockées;
à assurer la gestion nécessaire de l'utilisation des informations contenues dans la base d'informations.

Ainsi, une banque de données moderne est un complexe logiciel et matériel complexe, qui comprend des outils techniques, système et réseau, des bases de données et des SGBD, des systèmes de recherche d'informations à des fins diverses.

V .2. SGBD ET SOLUTIONS STRUCTURELLES DANS LES SYSTÈMES D'ENTREPRISE

Base de données et systèmes de gestion des connaissances

Les systèmes de gestion de bases de données (SGBD) constituent un élément important des systèmes d'information modernes.

SGBD - un ensemble de logiciels et d'outils linguistiques conçus pour créer, maintenir et utiliser des bases de données.

Le système de gestion de base de données permet l'accès des systèmes de traitement de données aux bases de données. Comme on l’a déjà noté, les SGBD acquièrent un rôle important dans la création de systèmes d’information d’entreprise et, un rôle particulièrement important, dans la création de systèmes d’information utilisant des ressources d’information distribuées basées sur des technologies informatiques de réseau modernes.

La principale caractéristique des SGBD modernes est que les SGBD modernes prennent en charge cesdes technologies comme:

Technologie client / serveur.
Prise en charge des langues de base de données. illangage de définition de schéma DB (SDL - Langage de définition de schéma),data Manipulation Language (DML), langages intégrésSQL (Structured Queue Language), QDB (Query - By - Example) et QMF (Query Management Facility ) Est un outil avancé de spécification de requête et de rapport de périphérique pourDB 2, etc.
Gestion directe des données dans la mémoire externe.
Gestion des tampons RAM.
Gestion des transactions. OLTP - technologie (Traitement des transactions en ligne), OLAP -la technologie (Traitement d'analyse en ligne)pour DW.
Assurer la protection et l'intégrité des données. L'utilisation du système n'est autorisée qu'aux utilisateurs qui ont le droit d'accéder aux données. Lorsque les utilisateurs effectuent des opérations sur les données, la cohérence des données stockées (intégrité) est maintenue. Ceci est important dans les systèmes d'information multi-utilisateurs d'entreprise.
Journalisation.

Les SGBD modernes doivent garantir la conformité aux exigences de base de données énumérées ci-dessus. De plus, ils doivent respecter les principes suivants:

L'indépendance des données.
Polyvalence. Le SGBD doit prendre en charge un modèle de données conceptuel puissant pour afficher des vues logiques personnalisées.
Compatibilité. Le SGBD doit rester opérationnel avec le développement des logiciels et du matériel.
Redondance des données. Contrairement aux systèmes de fichiers, une base de données doit être un ensemble unique de données intégrées.
Protection des données. Le SGBD doit fournir une protection contre les accès non autorisés.
Intégrité des données. Le SGBD doit empêcher les utilisateurs de casser la base de données.
Gestion du travail simultané. Le SGBD doit protéger la base de données des incohérences dans le mode d'accès partagé. Pour garantir un état cohérent de la base de données, toutes les demandes (transactions) des utilisateurs doivent être exécutées dans un ordre spécifique.
Le SGBD doit être universel. Il doit prendre en charge différents modèles de données sur une seule base logique et physique.
Le SGBD doit prendre en charge des bases de données centralisées et distribuées et, ainsi, devenir un maillon important des réseaux informatiques.

En considérant un SGBD comme une classe de produits logiciels visant à maintenir des bases de données dans des systèmes automatisés, nous pouvons distinguer deux caractéristiques les plus essentielles qui déterminent les types de SGBD. Selon eux, un SGBD peut être vu de deux points de vue:

leurs capacités par rapport aux bases de données distribuées (d'entreprise);
leur relation avec le type de modèle de données implémenté dans le SGBD.

En ce qui concerne les bases de données d'entreprise (distribuées), les types de SGBD suivants peuvent être distingués de manière conventionnelle:

SGBD "bureau". Ces produits sont principalement axés sur le travail avec des données personnelles (données «de bureau»). Ils ont des jeux de commandes pour partager des bases de données communes, mais de petite taille (comme un petit bureau). Tout d'abord, il s'agit d'un SGBD tel que Assess, dBASE, Paradox, EohPgo. Why Assess, dBASE, Paradox, EohPgo ont un accès limité aux données d'entreprise. Le fait est qu'il n'y a pas de moyen facile de surmonter la barrière entre les données personnelles et d'entreprise. Et le fait n'est même pas que le mécanisme du SGBD de données personnelles (ou petit bureau) se concentre sur l'accès aux données via de nombreuses passerelles, produits d'interréseautage, etc. Le problème est que ces mécanismes sont généralement associés à des transferts de fichiers complets et à un manque de prise en charge des index fourchus, ce qui entraîne le blocage des files d'attente des serveurs sur les grands systèmes.
SGBD multi-utilisateurs spécialisé haute performance. Ces SGBD se caractérisent par la présence d'un noyau système multi-utilisateur, d'un langage de manipulation de données et des fonctions suivantes typiques des SGBD multi-utilisateurs développés:
organisation du pool tampon;
la présence d'un système de traitement des files d'attente de transactions;
la présence de mécanismes de verrouillage des données multi-utilisateurs;
journalisation des transactions;
disponibilité de mécanismes de contrôle d'accès.

Ce sont des SGBD comme Oracle, DB2, SQL / Server, Informix, Sybase, ADABAS, Titanium et d'autres fournissent un large service pour le traitement des bases de données d'entreprise.

Lorsque vous travaillez avec des bases de données, le mécanisme de transaction est utilisé.

Transaction Est une unité logique de travail.

Transaction est une séquence d'instructions de manipulation de données exécutéesdans son ensemble (tout ou rien) et traduction de la base de donnéesd'un état holistique à un autre état holistique.

Il existe quatre propriétés importantes d'une transaction, appeléespropriétés ASID:

(A) Atomicité ... Une transaction est exécutée comme une opération atomique - soit la transaction entière est exécutée, soit elle n'est pas entièrement exécutée.
(C) Cohérence... Une transaction déplace une base de données d'un état cohérent (cohérent) vers un autre état cohérent (cohérent). Au sein d'une transaction, la cohérence de la base de données peut être violée.
(I) Isolation ... Les transactions des différents utilisateurs ne doivent pas interférer les unes avec les autres (par exemple, comme si elles étaient exécutées strictement à leur tour).
(E) Durabilité... Si la transaction est terminée, les résultats de son travail doivent être enregistrés dans la base de données, même si le moment suivant, le système tombe en panne.

La transaction démarre généralement automatiquement à partir du moment où l'utilisateur se connecte au SGBD et se poursuit jusqu'à ce que l'un des événements suivants se produise:

Commande COMMIT WORK émise.
Une commande ROLLBACK WORK a été émise.
L'utilisateur a été déconnecté du SGBD.
Il y a eu une panne du système.

Pour l'utilisateur, elle porte généralementcaractère atomique... En fait, il s'agit d'un mécanisme complexe d'interaction utilisateur (application) - base de données. Le logiciel des systèmes d'entreprise utilise un moteur de traitement des transactions en temps réel (Systèmes de traitement des transactions en ligne, OLTP), en particulier les logiciels de comptabilité, les logiciels de réception et de traitement des commandes clients, les applications financières, produisent beaucoup d'informations. Ces systèmes sont conçus (et optimisés de manière appropriée) pour gérer de grandes quantités de données, des transactions complexes et des opérations de lecture / écriture intensives.

Malheureusement, les informations placées dans les bases de données des systèmes OLTP ne conviennent pas très bien aux utilisateurs ordinaires (en raison du degré élevé de normalisation des tableaux, des formats de présentation des données spécifiques et d'autres facteurs). Par conséquent, les données de différents pipelines d'informations sont envoyées (dans le sens d'être copiées) àentrepôt de stockage, tri et livraison ultérieure au consommateur. Dans les technologies de l'information, le rôle des entrepôts est joué parstockages d'informations.

Fourniture d'informations à l'utilisateur final - systèmes de traitement des données analytiques en temps réel(Traitement analytique en ligne, OLAP)qui fournissent un accès extrêmement facile aux données grâce à des moyens pratiques de générer des requêtes et d'analyser les résultats. Dans les systèmes OLAP, la valeur d'un produit d'information augmente en raison de l'utilisation de diverses méthodes d'analyse et de traitement statistique. De plus, ces systèmes sont optimisés en termes de vitesse d'extraction des données, de collecte d'informations généralisées et s'adressent aux utilisateurs ordinaires (ils ont une interface intuitive). Si unSystème OLTP donne des réponses à des questions simples comme "quel était le niveau des ventes du produit N dans la région M en janvier 199x?", puisSystèmes OLAP prêt pour les demandes des utilisateurs plus complexes, par exemple: "Fournir une analyse des ventes du produit N dans toutes les régions selon le plan du deuxième trimestre par rapport aux deux années précédentes."

Architecture client / serveur

Dans les systèmes modernestraitement de l'information distribué, la technologie occupe une place centraleserveur client. Dans le système architecture client-serveur le traitement des données est réparti entre l'ordinateur client et l'ordinateur serveur, la communication entre eux ayant lieu sur le réseau. Cette séparation du traitement des données repose sur le regroupement des fonctions. En règle générale, un ordinateur serveur de base de données est dédié à l'exécution des opérations de base de données et un ordinateur client exécute des programmes d'application. La figure 2.1 montre un système d'architecture client-serveur simple qui comprend un ordinateur agissant en tant que serveur et un autre ordinateur agissant en tant que client. Chaque machine remplit différentes fonctions et dispose de ses propres ressources.

Serveur		Base de données
Ordinateur serveur
Net
PC compatible IBM	PC compatible IBM	PC compatible IBM
Clients		Applications

Figure: 2.1. Système d'architecture client-serveur

La fonction principale de l'ordinateur client est d'exécuter l'application (interface utilisateur et logique de présentation) et de communiquer avec le serveur lorsque cela est requis par l'application.

Serveur - est un objet (ordinateur) qui fournit des services à d'autres objets à leur demande.

Comme il ressort du terme lui-même, la fonction principale de l'ordinateur serveur est de répondre aux besoins du client. Le terme «Serveur» désigne deux groupes de fonctions différents: serveur de fichiers et serveur de base de données (ci-après, ces termes désignent, selon le contexte, soit un logiciel qui implémente les groupes de fonctions spécifiés, soit des ordinateurs équipés de ce logiciel). Les serveurs de fichiers ne sont pas conçus pour effectuer des opérations avec des bases de données, leur fonction principale est de partager des fichiers entre plusieurs utilisateurs, c'est-à-dire fournir un accès simultané de nombreux utilisateurs aux fichiers sur le serveur de fichiers de l'ordinateur. Le système d'exploitation NetWare de Novell est un exemple de serveur de fichiers. Le serveur de base de données peut être installé et utilisé sur un ordinateur serveur de fichiers. Oracle DBMS sous la forme de NLM (Network Loadable Module) est exécuté dans l'environnement NetWare sur le serveur de fichiers.

Un serveur de réseau local doit disposer des ressources adaptées à ses fonctionnalités et aux besoins du réseau. Notez qu'en raison de l'accent mis sur l'approche des systèmes ouverts, il est plus correct de parler de serveurs logiques (c'est-à-dire d'un ensemble de ressources et de logiciels qui fournissent des services sur ces ressources), qui ne sont pas nécessairement situés sur des ordinateurs différents. Une caractéristique d'un serveur logique dans un système ouvert est que si, pour des raisons d'efficacité, il est conseillé de déplacer le serveur vers un ordinateur distinct, cela peut être fait sans aucune modification, à la fois de lui-même et des applications qui l'utilisent.

L'une des exigences importantes du serveur est que le système d'exploitation hébergeant le serveur de base de données doit être multitâche (et de préférence, mais pas nécessairement, multi-utilisateur). Par exemple, un SGBD Oracle installé sur un ordinateur personnel avec un système d'exploitation MS-DOS (ou PC-DOS) qui ne répond pas aux exigences de multitâche ne peut pas être utilisé comme serveur de base de données. Et le même SGBD Oracle installé sur un ordinateur avec un système d'exploitation OS / 2 multitâche (mais pas multi-utilisateur) peut être un serveur de base de données. De nombreuses versions d'UNIX, MVS, VM et plusieurs autres systèmes d'exploitation sont à la fois multitâches et multi-utilisateurs.

Informatique distribuée

Le terme «informatique distribuée» est souvent utilisé pour désigner deux concepts différents, bien que complémentaires:

Base de données distribuée;
Traitement des données distribué.

L'application de ces concepts permet d'organiser l'accès aux informations stockées sur plusieurs machines pour les utilisateurs finaux par différents moyens.

Il existe de nombreux types de serveurs:

Serveur de base de données;
Serveur d'imprimante;
Serveur d'accès à distance;
Serveur de fax;
Serveur Web, etc.

Le client / serveur est au cœur de la technologie sous-jacente sont des technologies de base telles que:

Les technologies des systèmes d'exploitation, le concept d'interaction des systèmes ouverts, la création d'environnements orientés objet pour le fonctionnement des programmes;
Technologies des télécommunications;
Technologies de réseau;
Technologies d'interface utilisateur graphique (GUI);
Etc.

Avantages de la technologie client-serveur:

La technologie client / serveur permet d'effectuer des calculs sur des environnements informatiques hétérogènes. Indépendance de la plate-forme: accès à des environnements réseau hétérogènes qui incluent différents types d'ordinateurs avec différents systèmes d'exploitation.
Indépendance vis-à-vis des sources de données: accès aux informations issues de bases de données hétérogènes. Des exemples de tels systèmes sont DB2, SQL / DS, Oracle, Sybase.
Équilibre de charge entre le client et le serveur.
Effectuer le calcul là où il est le plus efficace;
Fournir la capacité d'évoluer efficacement;
Informatique multiplateforme... L'informatique multiplateforme est simplement définie comme la mise en œuvre de technologies dans des environnements informatiques hétérogènes. Ici, les possibilités suivantes doivent être fournies:
L'application doit s'exécuter sur plusieurs plates-formes;
Il doit avoir la même interface et la même logique sur toutes les plates-formes;
L'application doit s'intégrer à l'environnement d'exploitation natif;
Il doit se comporter de la même manière sur toutes les plateformes;
Il doit être fourni avec un support simple et cohérent.

 Informatique distribuée. L'informatique distribuée implique la répartition du travail entre plusieurs ordinateurs (bien que l'informatique distribuée soit un concept plus large).

 Réduction des effectifs. Le dégroupage est le transfert d'applications mainframe vers de petites plates-formes informatiques.

Réduction des coûts d'infrastructure et de matériel. Économique: la disponibilité d'équipements informatiques bon marché et l'utilisation croissante des réseaux locaux rendent la technologie client-serveur plus économique que les autres technologies de traitement de données. L'équipement peut être mis à niveau dès que le besoin s'en fait sentir.

 Réduction du temps d'exécution global des applications;

 Réduire l'utilisation de la mémoire du client;

 Réduire le trafic réseau.

Capacité à travailler avec le multimédia: à ce jour, de nombreux programmes multimédias ont été créés pour le PC. Il n'y a pas de tels programmes pour la configuration terminal-hôte, ou ils sont très coûteux.
La capacité d'attirer de grandes ressources informatiques pour les opérations de base de données: puisque les applications sont exécutées sur des ordinateurs clients, des ressources supplémentaires (par rapport à la configuration terminal-hôte) sont libérées sur l'ordinateur serveur pour les opérations de base de données, telles que les ressources informatiques du processeur central Mémoire.
Productivité accrue du programmeur: la productivité du programmeur est augmentée en utilisant des outils tels que SQL * Forms et CASE, qui vous permettent de développer des applications plus rapidement que les langages de programmation tels que C, PL1 ou COBOL.
Productivité accrue de l'utilisateur final: à l'heure actuelle, de nombreux utilisateurs finaux maîtrisent des systèmes tels que Lotus, Paradox, Word Perfect, Harvard Graphics, etc.

L'interface côté serveur est définie et fixe. Par conséquent, il est possible de créer de nouvelles parties client d'un système existant (un exemple d'interopérabilité au niveau du système).

Figure: 2.2. Illustration de l'accès client à un partage de serveur.

Comment mettre en œuvre la technologie client-serveur

La discussion suivante traite de l'installation d'un système basé sur la technologie client-serveur et capable d'effectuer un traitement de données distribué. Le matériel informatique et les logiciels suivants sont requis:

ordinateur serveur de base de données;
ordinateurs clients;
réseau de communication;
logiciel de réseau;
logiciel d'application.

Langage SQL ... Langage de requête de haut niveau -SQL (langage de requête structuré ) sert à la mise en œuvre de requêtes vers des bases de données, telles que YAMD, YOD et PNP et est adopté comme norme. LangueSQL a été initialement adopté comme langage de données des produits logiciels de l'entrepriseIBM et SGBD relationnel YAMDSYSTEM R d'IBM ... Une caractéristique importante de la langueSQL est que le même langage est présenté à travers deux interfaces différentes, à savoir, via une interface interactive et via une interface de programmation d'application (dynamiqueSQL). SQL dynamique se compose de nombreuses fonctionnalités de langage intégréesSQL , prévu spécifiquement pour la construction d'applications interactives, où une application interactive est comprise comme un programme qui est écrit pour prendre en charge l'accès à la base de données de l'utilisateur final travaillant sur le terminal interactif. LangueSQL fournit les fonctions de définition, de manipulation et de gestion des données de la base de données et est transparent pour l'utilisateur du point de vue du SGBD implémenté.

Figure: 2.3. Schéma d'exécution des requêtes utilisateur sur les bases de données distribuées.

La structure interne des bases de données est déterminée par les modèles de données utilisés. Le modèle conceptuel a plus de capacités d'abstraction et une sémantique plus riche que les modèles externes. Les modèles externes sont souvent appelés modèles syntaxiques ou opérationnels, faisant référence à la nature syntaxique du contrôle et de l'utilisation comme moyen d'interaction de l'utilisateur avec la base de données. Dans la modélisation de l'information, il existe différents niveaux d'abstraction, du modèle conceptuel au modèle de données physique, qui affectent l'architecture du SGBD.

Le modèle de données comporte trois composants:

La structure de données à représenter du point de vue de l'utilisateur de la base de données.
Opérations valides effectuées sur la structure de données. Il est nécessaire de pouvoir travailler avec cette structure à l'aide de diverses opérations NOD et NMD. Une structure riche est sans valeur s'il n'y a aucun moyen de manipuler son contenu.
Contraintes de contrôle d'intégrité. Le modèle de données devrait être doté de moyens pour maintenir son intégrité et le protéger. À titre d'exemple, considérons les deux contraintes suivantes:
Chaque sous-arbre doit avoir un nœud source. Les bases de données hiérarchiques ne peuvent pas stocker de nœuds enfants sans nœud source.
En ce qui concerne une base de données relationnelle, il ne peut pas y avoir de tuples identiques. Pour un fichier, cette exigence exige que tous les enregistrements soient uniques.

L'une des caractéristiques les plus importantes d'un SGBD est la possibilité de lier des objets.

Il existe les types de liens suivants entre les objets:

Un-à-un (1: 1)... Un objet d'un ensemble peut être associé à un objet d'un autre ensemble.
Un-à-plusieurs (1: M)... Un objet d'un ensemble peut être associé à de nombreux objets d'un autre ensemble.
Plusieurs à plusieurs (M: N)... Un objet d'un ensemble peut être associé à de nombreux objets d'un autre ensemble, mais un objet d'un autre ensemble peut être associé à de nombreux objets du premier ensemble.
Ramifié ... Un objet d'un ensemble peut être associé à des objets de plusieurs ensembles.
Récursif ... Un objet d'un ensemble donné peut être lié par un objet du même ensemble.

Les principaux modèles de données suivants existent:

Modèle de données relationnel.
Modèle de données hiérarchique.
Modèle de données réseau incomplet.
Modèle de données CODASYL.
Modèle de données réseau étendu.

V .3. TECHNOLOGIES INTERNET / INTRANET ET SOLUTIONS D'ENTREPRISE SUR L'ACCÈS AUX BASES DE DONNÉES

Le principal problème des systèmes basés sur une architecture client-serveur est que, conformément au concept de systèmes ouverts, ils doivent être mobiles dans la classe la plus large possible de solutions matérielles et logicielles de systèmes ouverts. Même si nous nous limitons aux réseaux locaux basés sur UNIX, différents réseaux utilisent des équipements et des protocoles de communication différents. Les tentatives de création de systèmes prenant en charge tous les protocoles possibles entraînent une surcharge des détails du réseau au détriment de la fonctionnalité.

Un aspect encore plus complexe de ce problème est lié à la possibilité d'utiliser différentes représentations de données dans différents nœuds d'un réseau local hétérogène. Différents ordinateurs peuvent avoir un adressage, une représentation numérique, un codage de caractères, etc. différents. Ceci est particulièrement important pour les serveurs de haut niveau: télécommunications, informatique, bases de données.

Une solution courante au problème de la mobilité dans les systèmes basés sur une architecture client-serveur consiste à s'appuyer sur des progiciels qui implémentent des protocoles d'appel de procédure à distance (RPC). Avec ces outils, un appel à un service sur un site distant ressemble à un appel de procédure normal. Les outils RPC, qui contiennent naturellement toutes les informations sur les spécificités du matériel du réseau local et des protocoles réseau, traduisent l'appel en une séquence d'interactions réseau. Ainsi, les spécificités de l'environnement réseau et des protocoles sont cachées au programmeur d'application.

Lorsqu'une procédure distante est appelée, les programmes RPC convertissent les formats de données client en formats intermédiaires indépendants de la machine, puis les convertissent en formats de données serveur. Lors du passage des paramètres de réponse, des transformations similaires sont effectuées.

D'autres oeuvres similaires qui pourraient vous intéresser. Wshm\u003e
6914.		Concept de base de données	11,56 Ko
	La base de données est présentée sous une forme objective, un ensemble de matériaux indépendants d'articles de calculs d'actes normatifs de décisions de justice et d'autres matériaux similaires systématisés afin que ces matériaux puissent être trouvés et traités à l'aide d'un ordinateur électronique Code civil de la Fédération de Russie Art. Une base de données organisée selon certaines règles et maintenue dans la mémoire de l'ordinateur est un ensemble de données caractérisant l'état actuel de certains ...
8064.		Bases de données distribuées	43,66 Ko
	Bases de données distribuées Une base de données distribuée RDB est comprise comme un ensemble de données partagées interconnectées logiquement qui sont physiquement réparties sur différents nœuds d'un réseau informatique. L'accès aux données ne doit pas dépendre de la présence ou de l'absence de répliques de données. Le système doit déterminer automatiquement les méthodes pour effectuer la connexion de fusion de données, un canal réseau capable de gérer le volume d'informations transmises et un nœud ayant une puissance de traitement suffisante pour connecter des tables. Le SGBDR doit être capable de ...
20319.		BASES DE DONNÉES ET LEUR PROTECTION	102,86 Ko
	Les bases de données en ligne en ligne ont vu le jour au milieu des années 1960. Les opérations sur les bases de données opérationnelles ont été traitées de manière interactive à l'aide de terminaux. Les organisations d'enregistrement séquentielles d'index simples ont rapidement évolué vers un modèle d'enregistrement orienté ensemble plus puissant. Charles Bachmann a reçu le prix Turing pour avoir dirigé le Data Base Task Group (DBTG), qui a développé un langage standard pour la description et la manipulation des données.
5031.		Bibliothèque de développement de base de données	11,72 Mo
	Technologie de conception de base de données. Déterminer les relations entre les entités et créer un modèle de données. Les idées principales des technologies modernes de l’information reposent sur le concept selon lequel les données doivent être organisées en bases de données afin de refléter de manière adéquate l’évolution du monde réel et de répondre aux besoins d’information des utilisateurs. Ces bases de données sont créées et fonctionnent sous le contrôle de systèmes logiciels spéciaux appelés systèmes de gestion de bases de données SGBD.
13815.		MODÈLE HIÉRARCHIQUE DE LA BASE DE DONNÉES	81,62 Ko
	Les principales idées de la technologie de l'information moderne sont basées sur le concept de bases de données, selon lequel la base de la technologie de l'information est des données organisées dans des bases de données qui reflètent adéquatement l'état d'un domaine particulier et fournissent à l'utilisateur des informations pertinentes dans ce domaine. Il faut reconnaître que les données sont ...
14095.		Développement de la base de données de la bibliothèque	11,72 Mo
	L'augmentation du volume et de la complexité structurelle des données stockées, l'élargissement du cercle des utilisateurs des systèmes d'information ont conduit à une utilisation généralisée du SGBD relationnel (tabulaire) le plus pratique et relativement facile à comprendre.
5061.		Création de la base de données de la clinique	2,4 Mo
	Le développement de la technologie informatique et des technologies de l’information a offert des possibilités de création et d’utilisation généralisée de systèmes d’information automatisés (SIA) à diverses fins. Des systèmes d'information pour la gestion des installations économiques et techniques sont en cours d'élaboration et de mise en œuvre
13542.		Bases de données d'informations géologiques	20,73 Ko
	Récemment, l’introduction des technologies informatiques et, en particulier, des bases de données, dans la sphère scientifique s’est rapidement déroulée. Ce processus ne contourne pas non plus la géologie, car c'est dans les sciences naturelles qu'il est nécessaire de stocker et de traiter de grandes quantités d'informations.
9100.		Base de données. Concepts de base	26,28 Ko
	Une base de données est une collection d'informations sur des objets spécifiques du monde réel dans n'importe quel domaine de l'économie, de la gestion, de la chimie, etc. Le but d'un système d'information n'est pas seulement de stocker des données sur des objets, mais aussi de manipuler ces données, en tenant compte des connexions entre objets. Chaque objet est caractérisé par un ensemble de données de propriétés, appelées attributs dans la base de données.
5240.		Création de la base de données "Dean's office"	1,57 Mo
	La base de données (DB) est un ensemble de données interconnectées stockées ensemble sur des supports de stockage externes d'un ordinateur, avec une telle organisation et une redondance minimale qui leur permet d'être utilisées de manière optimale pour une ou plusieurs applications

De plus en plus, les professionnels de l'informatique se tournent vers des solutions de gestion de données basées sur des modèles de données et des modèles de décision commerciale standard. Des modèles de données physiques complexes prêts à télécharger et des rapports de veille stratégique pour des domaines d'activité spécifiques vous permettent d'unifier la composante informationnelle de l'entreprise et d'accélérer considérablement l'exécution des processus métier. Les modèles de solution permettent aux fournisseurs de services d'exploiter la puissance des informations non standard cachées dans les systèmes existants, réduisant ainsi les délais, les coûts et les risques des projets. Par exemple, des projets réels montrent que le modèle de données et les modèles de décision commerciale peuvent réduire l'effort de développement de 50%.

Un modèle logique métier est une vue spécifique au domaine, intégrée et structurée de manière logique de toutes les informations qui doivent résider dans un entrepôt de données d'entreprise pour répondre à des questions commerciales stratégiques et tactiques. L'objectif principal des modèles est de faciliter l'orientation dans l'espace des données et d'aider à mettre en évidence les détails qui sont importants pour le développement commercial. Dans les conditions modernes, pour une entreprise prospère, il est impératif d'avoir une compréhension claire des liens entre les différents composants et une bonne idée de l'image globale de l'organisation. L'identification de tous les détails et relations à l'aide de modèles permet l'utilisation la plus efficace du temps et des outils d'organisation du travail de l'entreprise.

Les modèles de données sont des modèles abstraits qui décrivent comment les données sont présentées et accessibles. Les modèles de données définissent les éléments de données et les relations entre eux dans un domaine particulier. Un modèle de données est un outil de navigation pour les professionnels et les professionnels de l'informatique qui utilise un ensemble spécifique de symboles et de mots pour expliquer avec précision une classe spécifique d'informations du monde réel. Cela permet une meilleure communication au sein de l'organisation et crée ainsi un environnement d'application plus flexible et stable.

Un exemple de modèle SIG pour le gouvernement et le gouvernement local.

Aujourd'hui, il est stratégiquement important pour les fournisseurs de logiciels et de services d'être en mesure de réagir rapidement aux changements de l'industrie associés aux innovations technologiques, à la suppression des restrictions gouvernementales et à la complexité des chaînes d'approvisionnement. Parallèlement aux changements dans le modèle d'entreprise, la complexité et le coût de la technologie de l'information requise pour soutenir les opérations d'une entreprise augmentent. La gestion des données est particulièrement difficile dans un environnement où les systèmes d'information de l'entreprise et leurs exigences fonctionnelles et commerciales sont en constante évolution.

Les modèles de données de l'industrie sont conçus pour faciliter et rationaliser ce processus et amener l'approche informatique au niveau moderne.

Modèles de données industriels de l'entrepriseEsri

Les modèles de données Esri ArcGIS sont des modèles de travail à utiliser dans les projets SIG et pour créer des structures de données pour différents domaines d'application. La création de modèles de données implique la création d'une conception conceptuelle, d'une structure logique et physique qui peuvent ensuite être utilisées pour créer une géodatabase personnelle ou d'entreprise. ArcGIS fournit des outils pour créer et gérer votre schéma de base de données, et les modèles de modèle de données sont utilisés pour lancer rapidement un projet SIG dans une variété d'applications et de secteurs. Esri a passé un temps considérable avec la communauté des utilisateurs pour développer une gamme de modèles qui peuvent fournir un démarrage rapide à la conception d'une géodatabase d'entreprise. Ces projets sont décrits et documentés sur support.esri.com/datamodels. Vous trouverez ci-dessous, dans l'ordre dans lequel ils apparaissent sur ce site, une traduction sémantique des noms de modèles industriels d'Esri:

Registre d'adresses
Agriculture
Météorologie
Données spatiales de base
Biodiversité
Espace intérieur des bâtiments
Comptabilité des gaz à effet de serre
Maintenir les limites administratives
Établissement militaire. Service de renseignements
Énergie (y compris le nouveau protocole ArcGIS MultiSpeak)
Structures écologiques
Ministère des situations d'urgence. Pompiers
Cadastre forestier
Sylviculture
Géologie
SIG national (e-gov)
Eaux souterraines et eaux usées
Soins de santé
Archéologie et conservation des sites commémoratifs
la sécurité nationale
Hydrologie
Organisation hydrographique internationale (OHI). Format S-57 pour ENC
Irrigation
Cadastre
Gouvernement municipal
Navigation nautique
Cadastre de l'État
Structures pétrolières et gazières
Pipelines
Stockage raster
Bathymétrie, relief des fonds marins
Télécommunications
Transport
Approvisionnement en eau, assainissement, logement et services communaux

Ces modèles contiennent toutes les caractéristiques nécessaires de la norme de l'industrie, à savoir:

sont disponibles gratuitement;
ne sont pas liés à la technologie du fabricant «choisi»;
créé à la suite de la mise en œuvre de projets réels;
créé avec la participation d'experts de l'industrie;
sont conçus pour fournir une interaction d'informations entre divers produits et technologies;
ne contredisez pas les autres normes et réglementations;
utilisé dans des projets achevés à travers le monde;
sont conçus pour fonctionner avec des informations tout au long du cycle de vie du système en cours de création, et non avec le projet lui-même;
extensible selon les besoins du client sans perdre la compatibilité avec d'autres projets et / ou modèles;
accompagné de documents et d'exemples supplémentaires;
utilisé dans les directives et les documents techniques de diverses entreprises industrielles;
une grande communauté de participants, alors que l'accès à la communauté est ouvert à tous;
un grand nombre de références aux modèles de données dans les publications de ces dernières années.

Esri fait partie d'un groupe d'experts d'organismes indépendants qui recommandent divers modèles industriels, tels que PODS (Pipeline Open Data Standards for the oil and gas industry; PODS est actuellement mis en œuvre en tant que géodatabase Esri PODS Esri Spatial 5.1.1) ou une géodatabase (géodatabase) d'ArcGIS for Aviation, qui prend en compte les recommandations de l'OACI et de la FAA, ainsi que la norme d'échange de données de navigation AIXM 5.0. En outre, il existe des modèles recommandés qui adhèrent strictement aux normes existantes de l'industrie, telles que S-57 et ArcGIS for Maritime (caractéristiques marines et côtières), ainsi que des modèles créés à partir du travail effectué par Esri Professional Services et sont des normes de facto dans les zone. Par exemple, le SIG pour la nation et le gouvernement local a influencé les normes NSDI et INSPIRE, et l'hydroélectricité et les eaux souterraines (hydrologie et eaux souterraines) sont largement utilisées dans la suite professionnelle ArcHydro et les produits commerciaux disponibles gratuitement. des tiers. Il convient de noter qu'Esri prend également en charge les normes de facto telles que NHDI. Tous les modèles de données proposés sont documentés et prêts à être utilisés dans les processus informatiques de l'entreprise. Les matériaux d'accompagnement pour les modèles comprennent:

Diagrammes UML des relations entre les entités;
structures de données, domaines, répertoires;
modèles de géodatabase prêts à l'emploi au format ArcGIS GDB;
des échantillons de données et des exemples d'applications;
exemples de scripts de chargement de données, exemples d'utilitaires d'analyse;
ouvrages de référence sur la structure de données proposée.

Esri résume son expérience dans la construction de modèles industriels dans des livres et localise les documents publiés. Les livres suivants ont été localisés et publiés par Esri CIS:

Architecture orientée services géospatiaux (SOA);
Conception de géodatabases pour le transport;
Systèmes d'information géographique d'entreprise;
SIG: nouvelle énergie pour les entreprises électriques et gazières;
Pétrole et gaz sur une carte numérique;
Modéliser notre monde. Guide de conception de la géodatabase Esri;
Penser au SIG. Planification SIG: un guide pour les gestionnaires;
Systèmes d'information géographique. Les bases;
SIG pour la gestion administrative et économique;
SIG Web. Principes et applications;
Stratégies de conception de systèmes, 26e édition;
68 numéros du magazine ArcReview avec des publications d'entreprises et d'utilisateurs de systèmes SIG;
... et de nombreuses autres notes et publications thématiques.

Par exemple, le livre " Modéliser notre monde ..."(traduction) est un guide complet et une référence pour la modélisation de données SIG en général, et le modèle de données de géodatabase en particulier. Ce livre montre comment prendre les bonnes décisions de modélisation de données, des décisions qui sont impliquées dans tous les aspects d'un projet SIG, de la conception de la base de données à la collecte de données et de données pour l'analyse spatiale et la visualisation Décrit en détail comment concevoir une base de données géographique appropriée pour un projet, configurer la fonctionnalité de base de données sans programmation, gérer le flux de travail dans des projets complexes, modéliser diverses structures de réseau telles que les réseaux fluviaux, de transport ou électriques, intégrer l'imagerie satellite dans le processus d'analyse et d'affichage géographiques, et créer des modèles 3D de données SIG. Réserver " Conception de géodatabases pour le transport"contient des approches méthodologiques qui ont été testées sur un grand nombre de projets et sont pleinement conformes aux exigences législatives de l'Europe et des États-Unis, ainsi qu'aux normes internationales. Et dans le livre" SIG: Nouvelle énergie pour les centrales électriques et à gaz«À l'aide d'exemples concrets, il montre les avantages que le SIG d'entreprise peut apporter à un fournisseur d'énergie, y compris des aspects tels que le service client, l'exploitation du réseau et d'autres processus commerciaux.

Certains des livres, traduits et originaux, publiés en russe par Esri CIS et DATA +. Ils abordent à la fois des problèmes conceptuels liés à la technologie SIG et de nombreux aspects appliqués de la modélisation et du déploiement de SIG à diverses échelles et objectifs.

Nous considérerons l'application de modèles métiers à l'aide de l'exemple du BISDM (Building Interior Space Data Model, modèle d'information de l'espace interne d'un bâtiment) version 3.0. BISDM est un développement d'un modèle BIM (Building Information Model) plus général et est destiné à être utilisé dans la conception, la construction, l'exploitation et le démantèlement des bâtiments et des structures. Utilisé dans les logiciels SIG, il vous permet d'échanger efficacement des géodonnées avec d'autres plates-formes et d'interagir avec elles. Désigne le groupe général des tâches FM (gestion de l'infrastructure de l'organisation). Listons les principaux avantages du modèle BISDM, dont l'utilisation permet:

organiser l'échange d'informations dans un environnement hétérogène selon des règles uniformes;
obtenir une incarnation «physique» du concept BIM et des règles recommandées pour la gestion de projet de construction;
maintenir au moyen du SIG un stockage unique tout au long du cycle de vie d'un bâtiment (de la conception à la mise hors service);
coordonner le travail de divers spécialistes du projet;
visualiser le calendrier prévu et les étapes de construction pour tous les participants;
donner une estimation préliminaire du coût et du temps de construction (données 4D et 5D);
suivre l'avancement du projet;
assurer un fonctionnement de haute qualité du bâtiment, y compris l'entretien et les réparations;
faire partie du système de gestion des actifs, y compris les fonctions d'analyse de l'efficacité de l'utilisation de l'espace (location, entrepôt, gestion des employés);
calculer et gérer les objectifs d'efficacité énergétique du bâtiment;
simuler le mouvement des flux humains.

Le BISDM définit les règles de travail avec les données spatiales au niveau des locaux internes d'un bâtiment, y compris le but et les types d'utilisation, les communications posées, les équipements installés, la comptabilisation des réparations et de l'entretien, la journalisation des incidents, l'interconnexion avec d'autres actifs de l'entreprise. Le modèle permet de créer un référentiel unifié de données géographiques et non géographiques. L'expérience des plus grandes entreprises mondiales a été utilisée pour isoler les entités et modéliser au niveau de la géodatabase (géodatabase) les relations spatiales et logiques de tous les éléments physiques qui forment à la fois le bâtiment lui-même et son intérieur. Suivre les principes du BISDM peut simplifier considérablement les tâches d'intégration avec d'autres systèmes. La première étape est généralement l'intégration CAO. Ensuite, lors de l'exploitation du bâtiment, l'échange de données avec les systèmes ERP et EAM (SAP, TRIRIGA, Maximo, etc.) est utilisé.

Visualisation des éléments structurels BISDM à l'aide d'ArcGIS.

Dans le cas de l'utilisation du BISDM, le client / propriétaire de l'installation reçoit un échange d'informations de bout en bout de l'idée de créer un objet au développement d'un projet complet, le contrôle de la construction avec l'obtention d'informations pertinentes au moment de la mise en service de l'installation, le contrôle des paramètres pendant l'exploitation, et même pendant la reconstruction ou le déclassement de l'installation. Suivant le paradigme BISDM, le SIG et la base de données géographique créée avec son aide deviennent un référentiel de données commun pour les systèmes connexes. Souvent, le GDB contient des données créées et exploitées par des systèmes tiers. Ceci doit être pris en compte lors de la conception de l'architecture du système en cours de création.

À un certain stade, la "masse critique" d'informations accumulée permet de passer à un nouveau niveau qualitatif. Par exemple, à la fin de la phase de conception d'un nouveau bâtiment, il est possible de visualiser automatiquement des modèles de levés 3D dans un SIG, de compiler une liste des équipements installés, de calculer le kilométrage des utilités à poser, d'effectuer un certain nombre de vérifications et même de donner une estimation financière préliminaire du coût du projet.

Une fois de plus, nous notons que lorsque BISDM et ArcGIS sont utilisés ensemble, il devient possible de créer automatiquement des modèles 3D à partir des données accumulées, car la géodatabase contient une description complète de l'objet, y compris les coordonnées z, l'appartenance au sol, les types de connexions d'éléments, les méthodes d'installation des équipements, le matériau, les chemins disponibles mouvements de personnel, finalité fonctionnelle de chaque élément, etc. etc. Il convient de noter qu'après l'importation initiale de tous les matériaux de conception dans le BISDM GDB, il est nécessaire de disposer d'un contenu d'informations supplémentaire pour:

placement de modèles 3D d'objets et d'équipements dans des endroits désignés;
recueillir des informations sur le coût des matériaux et la procédure de leur pose et de leur installation;
contrôle cross-country en fonction des dimensions de l'équipement non standard installé.

En raison de l'utilisation d'ArcGIS, il est plus facile d'importer des objets 3D supplémentaires et des références à partir de sources externes, car L'interopérabilité des données ArcGIS vous permet de créer des procédures pour importer ces données et les placer correctement dans le modèle. Tous les formats utilisés dans l'industrie sont pris en charge, y compris IFC, AutoCAD Revit, Bentlye Microstation.

Modèles de données métiers d'IBM

IBM propose un ensemble d'outils et de modèles de gestion du stockage pour divers domaines d'activité:

Entrepôt de données IBM Banking and Financial Markets (finance)
Entrepôt de données bancaires IBM
Modèles de processus et de services bancaires IBM
Modèle de données IBM Health Plan (soins de santé)
IBM Insurance Information Warehouse (assurance)
IBM Insurance Process and Service Models
IBM Retail Data Warehouse (vente au détail)
IBM Telecommunications Data Warehouse (télécommunications)
Pack d'entrepôt InfoSphere:
- pour Customer Insight (pour comprendre les clients)
- pour Market and Campaign Insight (pour comprendre l'entreprise et le marché)
- pour Supply Chain Insight (pour comprendre les fournisseurs).

Par exemple, le modèle IBMBancaireetFinancierLes marchésLes donnéesEntrepôt est conçu pour répondre aux problèmes spécifiques du secteur bancaire en termes de données, et IBMBancaireProcessusetUn serviceDes modèles - en termes de processus et SOA (Service Oriented Architecture). Pour l'industrie des télécommunications, des modèles sont présentés IBMInformationFrameWork (IFW) et IBMTélécommunicationsLes donnéesEntrepôt (TDW)... Ils contribuent à accélérer considérablement le processus de création de systèmes analytiques, ainsi qu'à réduire les risques associés au développement d'applications de business intelligence, à la gestion des données d'entreprise et à l'organisation des entrepôts de données, en tenant compte des spécificités de l'industrie des télécommunications. Les capacités d'IBM TDW couvrent tout le spectre du marché des télécommunications - des fournisseurs Internet et des opérateurs de réseaux câblés offrant des services de téléphonie filaire et sans fil, la transmission de données et du contenu multimédia, aux sociétés multinationales fournissant des services de téléphonie, par satellite, longue distance et internationaux, ainsi qu'aux organisations. réseaux mondiaux. Aujourd'hui, TDW est utilisé par de petits et grands fournisseurs de services filaires et sans fil du monde entier.

Un outil appelé InfoSphere Warehouse Pack pour Customer Insight fournit un contenu commercial structuré et facile à déployer pour un nombre croissant de projets commerciaux et d'industries, notamment la banque, l'assurance, la finance, les programmes d'assurance maladie, les télécommunications, la vente au détail et la distribution. Pour les utilisateurs professionnels InfoSphere Warehouse Pack pour Market and Campaign Insight contribue à maximiser l'efficacité des analyses de marché et des campagnes de marketing grâce à un processus étape par étape de développement et de prise en compte des spécificités de l'entreprise. À travers InfoSphere Warehouse Pack pour l'analyse de la chaîne d'approvisionnement les organisations ont la capacité de recevoir des informations actuelles sur les opérations de la chaîne d'approvisionnement.

Position d'Esri au sein de l'architecture de la solution IBM.

L'approche IBM des utilitaires et des utilitaires est particulièrement remarquable. Pour répondre aux demandes croissantes des consommateurs, les services publics ont besoin d'une architecture plus flexible que celles utilisées aujourd'hui, ainsi que d'un modèle objet standard pour faciliter la libre circulation des informations. Cela améliorera les capacités de communication des services publics, permettant une interopérabilité plus rentable et donnant aux nouveaux systèmes une meilleure visibilité de toutes les ressources dont ils ont besoin, quel que soit leur emplacement au sein de l'organisation. La base de cette approche est SOA (Service Oriented Architecture), un modèle de composants qui cartographie les fonctions des départements et des services de diverses applications qui peuvent être réutilisées. Les «services» de tels composants échangent des données via des interfaces sans liaison rigide, cachant à l'utilisateur toute la complexité des systèmes derrière eux. Dans ce mode, les entreprises peuvent facilement ajouter de nouvelles applications quels que soient le fournisseur de logiciels, le système d'exploitation, le langage de programmation ou d'autres caractéristiques logicielles internes. Basé sur SOA, le concept est implémenté SÛR (Solution Architecture for Energy), il permet à l'entreprise de services publics d'obtenir une vision globale et normalisée de son infrastructure.

Esri ArcGIS® est une plate-forme logicielle mondialement reconnue pour les systèmes d'information géographique (SIG), qui fournit la création et la gestion d'actifs numériques de réseaux d'énergie électrique, de transport de gaz, de distribution et de télécommunications. ArcGIS vous permet de réaliser l'inventaire le plus complet des composants du réseau de distribution électrique, en tenant compte de leur localisation spatiale. ArcGIS étend considérablement l'architecture IBM SAFE en fournissant les outils, les applications, les flux de travail, les analyses et les capacités d'intégration des informations nécessaires pour gérer une entreprise d'énergie intelligente. ArcGIS dans le cadre d'IBM SAFE vous permet de recevoir des informations de diverses sources sur les installations d'infrastructure, les actifs, les clients et les employés avec des données précises sur leur emplacement, ainsi que de créer, stocker et traiter des informations géoréférencées sur les actifs de l'entreprise (supports, pipelines, câbles, transformateurs, goulottes etc.). ArcGIS au sein de l'infrastructure SAFE connecte de manière dynamique les applications métier principales en combinant les données des systèmes SIG, SCADA et de service client avec des informations externes telles que l'intensité du trafic, les conditions météorologiques ou les images satellite. Les services publics utilisent ces informations combinées à diverses fins, de S.O.R. (image globale de l'environnement d'exploitation) à l'inspection du site, à la maintenance, à l'analyse et à la planification du réseau.

Les composants d'information d'une entreprise de services publics peuvent être modélisés à l'aide de plusieurs niveaux allant du niveau le plus bas - physique - au niveau le plus élevé et le plus complexe de la logique métier. Ces couches peuvent être intégrées pour répondre aux exigences typiques de l'industrie, telles que l'enregistrement automatisé des mesures et la gestion SCADA. En construisant l'architecture SAFE, les services publics font des progrès significatifs dans la promotion d'un modèle d'objet ouvert à l'échelle de l'industrie appelé le modèle d'information commun (CIM) pour l'énergie et les services publics. Ce modèle fournit la base nécessaire pour faire évoluer de nombreuses entreprises vers une architecture orientée services car il encourage l'utilisation de normes ouvertes pour structurer les données et les objets. Du fait que tous les systèmes utilisent les mêmes objets, la confusion et l'inélasticité associées à différentes implémentations des mêmes objets seront réduites au minimum. Ainsi, la définition de l'objet client et d'autres objets métier importants sera unifiée dans tous les systèmes de l'utilitaire. Désormais, avec CIM, les fournisseurs de services et les consommateurs de services peuvent partager une structure de données commune, ce qui facilite l'externalisation de composants commerciaux coûteux, car CIM établit une base commune sur laquelle construire l'échange d'informations.

Conclusion

Des modèles de données sectoriels complets offrent aux entreprises une vue unique et intégrée de leurs informations commerciales. De nombreuses entreprises ont du mal à intégrer leurs données, bien que cela soit une condition préalable à la plupart des projets à l'échelle de l'entreprise. Selon une étude du Data Warehousing Institute (TDWI), plus de 69% des organisations interrogées ont trouvé que l'intégration était un obstacle important à l'adoption de nouvelles applications. Au contraire, la mise en œuvre de l'intégration de données apporte à l'entreprise un revenu tangible et une efficacité accrue.

Un modèle bien construit identifie de manière unique la signification des données, qui dans ce cas sont des données structurées (par opposition aux données non structurées telles qu'une image, un fichier binaire ou du texte, dont la signification peut être ambiguë). Les modèles industriels les plus efficaces sont ceux proposés par des fournisseurs professionnels tels qu'Esri et IBM. Le rendement élevé de l'utilisation de leurs modèles est obtenu grâce au niveau important de détails et de précision. Ils contiennent généralement de nombreux attributs de données. En outre, Esri et IBM possèdent une vaste expérience de la modélisation et maîtrisent parfaitement la création de modèles spécifiques à l'industrie.

Pour vendre, vous devez comprendre ce que nous vendons

Définissons la terminologie et les concepts. ( Entrepôt de données) N'est pas un système d'indicateurs clés de performance (KPI, KPI), ce n'est pas une grande base de données, ce n'est pas une base analytique Outil OLAP, ce n'est pas un système intelligent qui vous permet d'extraire de nouvelles données et d'obtenir des dépendances statistiques, ce n'est pas un système d'une seule donnée de référence - tout cela n'est pas un CD, si nous en parlons dans le contexte d'un seul élément.

Entrepôt de données d'entreprise – il s'agit d'un tableau spécialement organisé de données d'entreprise (organisation), traitées et stockées dans un seul complexe matériel et logiciel, qui fournit un accès rapide aux informations opérationnelles et historiques, une analyse multidimensionnelle des données (KPI pour diverses dimensions), l'obtention de prévisions et de statistiques en fonction de la norme et informations de référence (NSI).

Clients potentiels de l'entrepôt de données d'entreprise et qu'obtiennent-ils?

Comment identifier les clients professionnels potentiels à la recherche d'un entrepôt de données?

Tout d'abord, beaucoup d'informations doivent surgir dans les activités quotidiennes de l'entreprise. Il peut s'agir d'appels téléphoniques, de transactions financières, de plaintes / avis clients, de demandes d'expédition de clients, d'informations provenant de satellites espions, etc. En principe, quoi que ce soit, l'essentiel est qu'il y ait beaucoup de données.
Le client potentiel doit avoir le désir de voir et d'analyser ces informations. Dans ce cas, la période d'analyse doit être assez longue - d'une journée, voire d'une heure, à une analyse de plusieurs années.
Le client doit disposer d'une infrastructure fonctionnant normalement (il ne doit y avoir aucun serveur connecté par un câble à paire torsadée ou via un port USB). Si le client n'a pas d'infrastructure, il doit la vendre.

Quels avantages un client tire-t-il de la mise en œuvre d'un entrepôt de données d'entreprise?

Un système d'information unifié pour stocker des données d'entreprise apparaît, dans lequel une information de référence unifiée est utilisée.
Il devient possible de mener une analyse complète de l'entreprise. Par exemple: quels clients sont les plus rentables et les plus rentables; quel service est le plus demandé auprès de quels clients, quel type de réclamation est le plus fréquent et dans quelles régions, etc.
Il devient possible de réaliser des analyses à partir de données historiques. Souvent, les systèmes opérationnels (automatisation des processus métier quotidiens) ne permettent pas de faire cela, ils n'ont tout simplement pas assez d'espace pour stocker l'historique et la capacité d'analyse.
Il devient possible de connecter et d'analyser des informations qui étaient auparavant stockées dans différents systèmes d'information. Par exemple, les données de trafic pour différentes succursales sont stockées dans des systèmes de facturation de différents développeurs. Après la mise en œuvre du CD, il devient possible de les analyser ensemble, dans un seul rapport.
Il devient possible d'analyser et de croiser des données de différents types. Par exemple, l'argent et le trafic, le nombre d'employés et le nombre de refus ou de réclamations, etc.
Une base apparaît pour un meilleur calcul du coût des services - sur la base des informations de l'entrepôt de données d'entreprise, il est possible d'obtenir des données plus adéquates pour les bases de distribution naturelle.

Qu'est-ce qu'un entrepôt de données d'entreprise

D'un point de vue technique, quels composants un entrepôt de données d'entreprise utilise-t-il?

Composants entrepôt de données d'entreprise entreprises

Le client a toujours des systèmes d'exploitation - source d'information pour l'entrepôt de données d'entreprise. Il s'agit par exemple de la comptabilité, de la facturation, des opérations bancaires, etc. systèmes.
En utilisant Application ETL (logiciel qui vous permet d'extraire, de transformer et de charger des données), les données des systèmes source tombent dans la base de données de l'entrepôt de données. Les éléments suivants peuvent être utilisés comme outils ETL: Informatica Power Center, IBM DataStage, Oracle Data Integrator, Oracle WareHouse Builder. Il existe également des produits d'autres fournisseurs, mais ils ne sont presque pas représentés sur le marché russe.
Lui-même base de données le stockage d'entreprise n'est pas abstrait dans sa structure (un ensemble de tables, des champs et des relations entre les tables), mais est créé sur la base de modèles de données. La très grande majorité utilise Oracle ou Teradata comme base de données.
Modèle de données est une description de toutes les entités, objets de base de données de l'entrepôt de données d'entreprise et comprend: modèle de données conceptuel, modèle de données logique et physique modèle de base de données ... Au niveau du modèle conceptuel, les entités et les relations entre elles sont déterminées. Au niveau du modèle logique, les entités sont divisées en domaines d'activité, elles reçoivent une description détaillée et complète et les relations sont écrites. Lors du développement d'un modèle de base de données physique, la structure entière de la base de données est déterminée - depuis les tables et les champs qu'elles contiennent, jusqu'aux partitions et index. Modèles de données Aujourd'hui, IBM, SAP et Oracle fournissent le marché, mais l'achat d'un modèle de données ne signifie pas automatiquement la construction du bon entrepôt d'entreprise. Modèle de données n'est pas un produit en boîte. Il doit être modifié pour les besoins d'un client particulier.
De plus, en utilisant déjà les données de l'entrepôt de données d'entreprise, les domaines d'analyse, de reporting et datamarts... Par la suite, les utilisateurs peuvent créer indépendamment les rapports nécessaires et effectuer une analyse multidimensionnelle. Business Objects, Oracle Discoverer, IBM AlphaBlocks et d'autres produits sont principalement utilisés comme outils d'analyse.

À quoi ressemblent les composants d'un entrepôt de données d'entreprise (modèle de données, processus ETL, data marts)

Nous donnerons des exemples illustratifs de modèle de données, de mise en œuvre du processus ETL, de formes de prise en charge d'une seule donnée de référence, de data marts.

Modèle logique Les données.
Définit les entités, leurs attributs et les relations entre elles.

Processus ETL éliminer les doublons dans les données source

Formulaire de saisie de données pour la formation d'un annuaire unifié

Vitrine des données sous forme de rapport tabulaire

Vitrine des données avec des graphismes et des couleurs
sortie de données sur une condition donnée

Vitrine des données avec horaire

Logiciels et matériel associés

Tout d'abord, en plus des services de développement d'un entrepôt de données d'entreprise, des licences sont également vendues à la fois pour les logiciels serveur (OS, base de données, serveur d'application, etc.) et pour les sites clients (protection antivirus et sécurité).

Les serveurs existants du client peuvent ne pas être conçus pour le déploiement de la banque de données. Il est nécessaire de leur proposer des exigences et de vendre le matériel à un client potentiel.

Outre les serveurs eux-mêmes, les baies de disques sont nécessaires pour stocker une quantité importante d'informations.

Dans l'intention de construire un entrepôt de données d'entreprise, un client potentiel ne comprend pas toujours comment il assurera la sauvegarde. Souvent, les systèmes de sauvegarde existants du client ne sont pas capables de connecter simultanément des volumes de données de 20 à 30 To à la sauvegarde.

En règle générale, les spécialistes et les utilisateurs du client ont besoin de cours de formation.

Kovtun M.V. Août 2010

Envoyez votre bon travail dans la base de connaissances est simple. Utilisez le formulaire ci-dessous

Les étudiants, les étudiants diplômés, les jeunes scientifiques utilisant la base de connaissances dans leurs études et leurs travaux vous seront très reconnaissants.

Posté sur http://www.allbest.ru/

1. Modèle de données relationnel

1.1 Le modèle de données relationnelles. Définitions basiques
1.2 Opérations sur les relations

2. Systèmes d'information d'entreprise
Bibliographie

1. Modèle de données relationnel

1.1 Le modèle de données relationnelles. Définitions basiques

Dans les disciplines mathématiques, le concept de «table» correspond au concept de «relation» (relation). Le tableau reflète un objet du monde réel - une entité, et chacune de ses lignes reflète une instance spécifique de l'entité. Chaque colonne a un nom unique à la table. Les chaînes n'ont pas de nom, leur ordre n'est pas défini et le nombre est logiquement illimité. L'un des principaux avantages d'un modèle de données relationnel est l'homogénéité (chaque ligne d'un tableau a le même format). Il appartient à l'utilisateur de décider si les entités respectives sont homogènes. Cela résout le problème de l'adéquation du modèle.

Concepts de base:

* Un ratio est un tableau bidimensionnel contenant des données.

* Entité - un objet de toute nature, dont les données sont stockées dans la base de données. Les attributs sont des propriétés qui caractérisent une entité (colonnes).

* Le degré de relation est le nombre de colonnes.

* Schéma de relation - une liste de noms d'attributs, par exemple, EMPLOYÉ (No., Nom complet, Année de naissance, Poste, Département).

* Domaine - un ensemble de valeurs des attributs d'une relation (type de données).

* Un tuple est une ligne de table.

* Cardinalité (cardinalité) - le nombre de lignes dans le tableau.

* La clé primaire est un attribut qui identifie de manière unique les lignes d'une relation. Une clé primaire multi-attribut est appelée composite. La clé primaire ne peut pas être complètement ou partiellement vide (null). Les clés qui peuvent être utilisées comme clés primaires sont appelées clés potentielles ou alternatives.

* Une clé étrangère est un attribut (s) d'une table qui peut servir de clé primaire d'une autre table. Référence la clé primaire d'une autre table.

La normalisation est un processus visant à réduire la redondance des informations dans une base de données. En plus des données elles-mêmes, divers noms, noms d'objets et expressions peuvent également être normalisés dans la base de données.

Une base de données non normalisée contient des informations dans une ou plusieurs tables différentes; l'impression est que l'inclusion de données dans un tableau particulier n'est pas due à une raison apparente. Cet état de fait peut avoir un impact négatif sur la sécurité des données, l'utilisation rationnelle de l'espace disque, la vitesse des requêtes, l'efficacité de la mise à jour de la base de données et, peut-être surtout, l'intégrité des informations stockées. La base de données avant la normalisation est une structure qui n'a pas été logiquement décomposée en tables plus petites et plus faciles à gérer.

La forme normale est une sorte d'indicateur du niveau, ou de la profondeur, de la normalisation de la base de données. Le niveau de normalisation de la base de données correspond à la forme normale dans laquelle elle se trouve.

1.2 Opérations sur les relations

Pour amener la table à la première forme normale (1NF), vous devez suivre deux règles:

1. Atomicité ou indivisibilité. Chaque colonne doit contenir une valeur indivisible.

2. Le tableau ne doit pas contenir de colonnes ou de groupes de données en double.

Par exemple, si une table contient dans un champ l'adresse complète d'une personne (rue, ville, code postal), elle ne sera pas conforme aux règles 1NF, car elle contiendra différentes valeurs dans une colonne, ce qui constituerait une violation de la règle d'atomicité. Ou si la base de données contient des données sur les films et contient les colonnes acteur1, acteur2, acteur3, elle ne sera pas non plus conforme aux règles, car les données seront répétées.

La normalisation doit commencer par vérifier la structure de la base de données pour la compatibilité avec 1NF. Toutes les colonnes qui ne sont pas atomiques doivent être divisées en leurs colonnes constituantes. S'il y a des colonnes en double dans le tableau, ils doivent sélectionner un tableau distinct.

Pour ramener la table à sa première forme normale, vous devez:

* Trouvez tous les champs contenant plusieurs informations.

* Les données pouvant être décomposées en composants doivent être placées dans des champs séparés.

* Déplacez les données en double dans une table séparée.

* Vérifiez si toutes les tables correspondent aux conditions de la première forme normale.

Pour amener les tables à la deuxième forme normale (2NF), les tables doivent déjà être dans 1NF. La normalisation doit être effectuée dans l'ordre.

Maintenant, dans la deuxième forme normale, la condition doit être remplie - toute colonne qui n'est pas une clé (y compris étrangère) doit dépendre de la clé primaire. En règle générale, ces colonnes dont les valeurs sont indépendantes de la clé sont faciles à identifier. Si les données contenues dans la colonne ne sont pas liées à la clé qui décrit la ligne, elles doivent être séparées dans leur propre tableau distinct. La clé primaire doit être retournée à l'ancienne table.

Pour amener la base à la deuxième forme normale, vous avez besoin de:

* Identifiez toutes les colonnes qui ne dépendent pas directement de la clé primaire de cette table.

* Créez les champs obligatoires dans les tables des utilisateurs et des forums, sélectionnez parmi les champs existants ou créez des clés primaires à partir de nouvelles.

* Chaque table a besoin de sa propre clé primaire

* Créer des clés étrangères et désigner leurs relations entre les tables. La dernière étape de normalisation vers 2NF sera l'attribution de clés étrangères pour la communication avec les tables associées. La clé primaire d'une table doit être une clé étrangère dans une autre.

Conseils:

Une autre façon de convertir un schéma en 2NF consiste à examiner les relations entre les tables. Idéalement, créez toutes les relations un-à-plusieurs. Les relations plusieurs-à-plusieurs doivent être restructurées.

Une table correctement normalisée n'aura jamais de lignes en double (deux ou plusieurs lignes dont les valeurs ne sont pas des clés et contiennent les mêmes données).

La base de données sera sous la troisième forme normale si elle est convertie en deuxième forme normale et chaque colonne non clé est indépendante l'une de l'autre. Si vous suivez correctement le processus de normalisation jusqu'à ce point, il se peut que la conversion en 3NF ne pose aucune question. Vous devez être conscient que 3NF est violé si la modification de la valeur dans une colonne nécessite une modification dans une autre colonne.

Pour amener la base à la troisième forme normale, vous avez besoin de:

* Déterminez quels champs de quelles tables ont des interdépendances, c'est-à-dire champs qui dépendent plus les uns des autres que de la ligne dans son ensemble.

* Créez des tableaux correspondants. S'il y a une colonne problématique à l'étape 1, créez des tables fractionnées pour elle.

* Créez ou allouez des clés primaires. Chaque table doit avoir une clé primaire.

* Créez les clés étrangères requises qui forment l'une des relations.

Dans la quatrième forme normale, une règle supplémentaire consiste à exclure les dépendances à valeurs multiples. En d'autres termes, toutes les lignes d'une table doivent être indépendantes les unes des autres. La présence d'une ligne X ne doit pas signifier que la ligne Y est également quelque part dans ce tableau.

2. Systèmes d'information institutionnels

système de données de modèle relationnel

Un système (du grec systema - un tout, un composé composé de parties) est une collection d'éléments qui interagissent les uns avec les autres, formant une certaine intégrité, unité. Voici quelques concepts souvent utilisés pour caractériser un système.

1. Élément du système - une partie du système qui a un objectif fonctionnel spécifique. Les éléments complexes des systèmes, à leur tour, constitués d'éléments interconnectés plus simples, sont souvent appelés sous-systèmes.

2. Organisation du système - ordre interne, cohérence de l'interaction des éléments du système, se manifestant notamment par la limitation de la variété des états des éléments au sein du système.

3. La structure du système - la composition, l'ordre et les principes d'interaction des éléments du système, qui déterminent les propriétés de base du système. Si les éléments individuels du système sont espacés sur différents niveaux et que les connexions internes entre les éléments ne sont organisées que des niveaux supérieurs aux niveaux inférieurs et vice versa, alors nous parlons de la structure hiérarchique du système. Les structures purement hiérarchiques sont pratiquement rares, par conséquent, élargissant quelque peu ce concept, la structure hiérarchique est généralement comprise comme de telles structures, où, entre autres connexions, les relations hiérarchiques sont d'une importance primordiale.

4. Architecture du système - un ensemble de propriétés du système qui sont essentielles pour l'utilisateur.

5. Intégrité du système - l'irréductibilité fondamentale des propriétés du système à la somme des propriétés de ses éléments individuels (émergence de propriétés) et, en même temps, la dépendance des propriétés de chaque élément sur sa place et sa fonction dans le système.

Le système d'information est un ensemble interconnecté de moyens, de méthodes et de personnel utilisé pour stocker, traiter et diffuser des informations afin d'atteindre l'objectif fixé "

La loi fédérale "sur l'information, l'informatisation et la protection de l'information" donne la définition suivante:

"Le système d'information est un ensemble organisé de documents (tableaux de documents) et de technologies de l'information, y compris l'utilisation de la technologie informatique et de la communication, réalisant des processus d'information"

Classification d'échelle

Par échelle, les systèmes d'information sont répartis dans les groupes suivants:

* Célibataire;

* groupe;

* entreprise.

Un système d'information d'entreprise est un système évolutif conçu pour l'automatisation intégrée de tous les types d'activités économiques des grandes et moyennes entreprises, y compris les sociétés constituées d'un groupe d'entreprises nécessitant une gestion unifiée.

Un système d'information d'entreprise peut être considéré comme un système qui automatise plus de 80% des divisions de l'entreprise.

Récemment, dans de nombreuses publications consacrées à l'utilisation des technologies de l'information dans la gestion des objets économiques, le terme «systèmes d'information d'entreprise» est souvent utilisé, ce qui signifie en eux les systèmes d'information automatisés réels d'objets économiques.

Un système d'information automatisé (SIA) est une combinaison de différents types de support, ainsi que de spécialistes conçus pour automatiser le traitement des informations comptables et analytiques. En règle générale, les types de sécurité sont homogènes pour différents systèmes, ce qui permet de mettre en œuvre le principe de compatibilité des systèmes au cours de leur fonctionnement. Dans le processus d'étude de l'AIS en tant que système complexe, il est nécessaire de distinguer les pièces et éléments individuels et de considérer les caractéristiques de leur utilisation aux étapes de la création et de l'exploitation.

Les systèmes d'information d'entreprise sont une évolution des systèmes pour les groupes de travail, ils sont axés sur les grandes entreprises et peuvent prendre en charge des nœuds ou des réseaux géographiquement dispersés. Fondamentalement, ils ont une structure hiérarchique à plusieurs niveaux. De tels systèmes se caractérisent par une architecture client-serveur avec une spécialisation des serveurs ou une architecture multi-niveaux. Lors du développement de tels systèmes, les mêmes serveurs de bases de données peuvent être utilisés que lors du développement de systèmes d'information de groupe. Cependant, dans les grands systèmes d'information, les serveurs les plus utilisés sont Oracle, DB2 et Microsoft SQL Server.

Pour les systèmes de groupe et d'entreprise, les exigences en matière de fiabilité de fonctionnement et de sécurité des données sont considérablement augmentées. Ces propriétés sont fournies en maintenant l'intégrité des données, des références et des transactions dans les serveurs de base de données.

Classification par périmètre

Selon le domaine d'application, les systèmes d'information sont généralement divisés en quatre groupes:

* systèmes de traitement des transactions;

* systèmes de prise de décision;

* systèmes d'information et de référence;

* systèmes d'information de bureau.

Bibliographie

1. Agaltsov, V.P. Base de données. En 2 volumes V. 2. Bases de données distribuées et distantes: Textbook / V.P. Agaltsov. - M.: ID FORUM, NITs INFRA-M, 2013.

2. Golitsyna, O. L. Bases de données: Textbook / O.L. Golitsyna, N.V. Maksimov, I.I. Popov. - M .: Forum, 2012.

3. Karpova, I.P. Bases de données: Textbook / I.P. Karpov. - SPb.: Peter, 2013.

4. Kirillov, V.V. Introduction aux bases de données relationnelles Introduction aux bases de données relationnelles. Kirillov, G.Yu. Gromov. - SPb.: BHV-Pétersbourg, 2012.

5. Pirogov, V.Yu. Systèmes d'information et bases de données: organisation et conception: Textbook / V.Yu. Pirogov. - SPb.: BHV-Pétersbourg, 2009.

6. G.N. Fedorov. Systèmes d'information. - M.: Académie, 2013.

7. A.E. Satunina, L.A. Sysoeva. Gestion de projet du système d'information corporatif de l'entreprise. - M.: Finances et statistiques, Infra-M, 2009.

Publié sur Allbest.ru

...

Documents similaires

L'essence et les caractéristiques des types de modèles de données: hiérarchique, réseau et relationnel. Concepts de base du modèle de données relationnel. Attributs, schéma de relation de base de données. Conditions d'intégrité des données. Relations entre les tables. Compréhension générale du modèle de données.

term paper ajouté le 29/01/2011

Systèmes d'information et bases de données d'entreprise, leur utilisation pour améliorer et déboguer les affaires. Classification des systèmes d'information d'entreprise. Systèmes d'information de classe OLTP. Traitement analytique rapide.

term paper, ajouté le 19/01/2011

Bases de données avec fichiers bidimensionnels et systèmes de gestion de bases de données relationnelles (SGBD). Création d'une base de données et traitement des requêtes vers eux à l'aide d'un SGBD. Types de bases de données de base. Concepts de base des bases de données relationnelles. Propriétés fondamentales des relations.

résumé, ajouté le 20/12/2010

Concept de système de base de données. Le modèle relationnel et ses caractéristiques. Intégrité dans le modèle relationnel. Algèbre relationnelle. Problèmes de conception de base de données. Formes normales de relations. Conception de base de données à l'aide de la méthode des relations d'entité. Diagrammes ER. Langage SQL.

un cours de conférences ajouté le 10/03/2008

Une structure logique définie de données qui est stockée dans une base de données. Modèles de données de base. Éléments du modèle de données relationnel. Un exemple d'utilisation de clés étrangères. Exigences de base pour la relation du modèle de données relationnel.

présentation ajoutée le 14/10/2013

Bases de données et leur utilisation en informatique. Fonctionnalités et élément de base du modèle de données réseau. Modèle hiérarchique, objets du domaine. Modèle relationnel, sa visibilité, présentation des données sous forme de tableau.

résumé, ajouté le 19/12/2011

Types et fonctions du système de gestion de base de données Microsoft Access. Modèle hiérarchique, réseau, relationnel pour la description des bases de données. Concepts de base des tables de base de données. Caractéristiques de la création d'objets de base de données, formulaires de base. Accès à Internet dans Access.

test, ajouté le 01/08/2011

Systèmes de gestion de base de données modernes (SGBD). Analyse du modèle de données hiérarchique. Modèle de données relationnel. Modèle de données post-relationnel en tant que modèle relationnel étendu qui supprime la restriction sur l'indivisibilité des données stockées dans les enregistrements de table.

travail scientifique, ajouté le 06/08/2010

Modèles de données dans la gestion de bases de données. Modèles de données conceptuels. Le rôle des bases de données dans les systèmes d'information. Modèle de données relationnel. Définition du domaine. Construction d'un modèle de base de données pour le système d'information "Pets".

term paper, ajouté le 19/04/2011

Modèle d'information dans Access comme une sorte de substitut simplifié pour un objet ou un système réel. Structures de base qui déterminent l'organisation des données et les relations entre elles; un type d'organisation relationnelle des données. Un exemple de base de données en fiscalité.

LA CLOCHE

Modèle de données d'entreprise

introduction

Modèle de données d'entreprise

Niveaux de présentation du modèle de données d'entreprise

THÈME V. BASES DE DONNÉES D'ENTREPRISE

Clients potentiels de l'entrepôt de données d'entreprise et qu'obtiennent-ils?

Qu'est-ce qu'un entrepôt de données d'entreprise

À quoi ressemblent les composants d'un entrepôt de données d'entreprise (modèle de données, processus ETL, data marts)

Logiciels et matériel associés

Envoyez votre bon travail dans la base de connaissances est simple. Utilisez le formulaire ci-dessous

1. Modèle de données relationnel

2. Systèmes d'information institutionnels

système de données de modèle relationnel

Un système (du grec systema - un tout, un composé composé de parties) est une collection d'éléments qui interagissent les uns avec les autres, formant une certaine intégrité, unité. Voici quelques concepts souvent utilisés pour caractériser un système.

1. Élément du système - une partie du système qui a un objectif fonctionnel spécifique. Les éléments complexes des systèmes, à leur tour, constitués d'éléments interconnectés plus simples, sont souvent appelés sous-systèmes.

2. Organisation du système - ordre interne, cohérence de l'interaction des éléments du système, se manifestant notamment par la limitation de la variété des états des éléments au sein du système.

4. Architecture du système - un ensemble de propriétés du système qui sont essentielles pour l'utilisateur.

5. Intégrité du système - l'irréductibilité fondamentale des propriétés du système à la somme des propriétés de ses éléments individuels (émergence de propriétés) et, en même temps, la dépendance des propriétés de chaque élément sur sa place et sa fonction dans le système.

Le système d'information est un ensemble interconnecté de moyens, de méthodes et de personnel utilisé pour stocker, traiter et diffuser des informations afin d'atteindre l'objectif fixé "

La loi fédérale "sur l'information, l'informatisation et la protection de l'information" donne la définition suivante:

"Le système d'information est un ensemble organisé de documents (tableaux de documents) et de technologies de l'information, y compris l'utilisation de la technologie informatique et de la communication, réalisant des processus d'information"

Classification d'échelle

Par échelle, les systèmes d'information sont répartis dans les groupes suivants:

* Célibataire;

* groupe;

* entreprise.

Un système d'information d'entreprise est un système évolutif conçu pour l'automatisation intégrée de tous les types d'activités économiques des grandes et moyennes entreprises, y compris les sociétés constituées d'un groupe d'entreprises nécessitant une gestion unifiée.

Un système d'information d'entreprise peut être considéré comme un système qui automatise plus de 80% des divisions de l'entreprise.

Classification par périmètre

Selon le domaine d'application, les systèmes d'information sont généralement divisés en quatre groupes:

* systèmes de traitement des transactions;

* systèmes de prise de décision;

* systèmes d'information et de référence;

* systèmes d'information de bureau.

Bibliographie

Documents similaires

Lire aussi

Tarif MTS "Tablet Mini": description

Pneus et jantes pour Nissan X-Trail, dimensions de jantes pour Nissan X-Trail

Internet mobile et communication cellulaire en Crimée - Itinérance Beeline, MTS, Megafon, Tele2

LA CLOCHE