Lo scopo della lezione

Dopo aver studiato il materiale di questa lezione, saprai:

che cosa modello di dati aziendali ;
come convertire modello di dati aziendali nel modello di data warehouse;
elementi principali modello di dati aziendali ;
livelli di presentazione del modello di dati aziendali ;
algoritmo per trasformare un modello di dati aziendali in un modello di data warehouse multidimensionale ;

e impara a:

sviluppare modelli di data warehouse basati su modello di dati aziendali organizzazioni;
progettare uno schema a stella utilizzando gli strumenti CASE;
tabelle delle partizioni modello multidimensionale utilizzando gli strumenti CASE.

Modello di dati aziendali

introduzione

Il cuore di qualsiasi HD è il suo modello di dati. Senza un modello di dati, sarà molto difficile organizzare i dati nell'HD. Pertanto, gli sviluppatori HD dovrebbero dedicare tempo e sforzi allo sviluppo di un tale modello. Lo sviluppo del modello HD ricade sulle spalle del designer HD.

Rispetto alla progettazione dei sistemi OLTP, la metodologia di progettazione del CD presenta una serie di caratteristiche distintive associate all'orientamento delle strutture dei dati di archiviazione per risolvere i problemi di analisi e supporto informativo del processo decisionale. Il modello di dati HD dovrebbe fornire una soluzione efficace proprio a questi problemi.

Il punto di partenza nella progettazione di CD può essere il cosiddetto modello di dati aziendali (modello di dati aziendali o modello di dati aziendali, EDM), che viene creato durante il processo di progettazione dei sistemi OLTP di un'organizzazione. Durante la progettazione modello di dati aziendali di solito si tenta di creare una struttura dati basata su operazioni aziendali che raccolga e sintetizzi tutte le esigenze informative di un'organizzazione.

Quindi, modello di dati aziendali contiene le informazioni necessarie per costruire un modello CD. Pertanto, nella prima fase, se un tale modello esiste nell'organizzazione, il progettista HD può avviare il progetto HD risolvendo il problema della trasformazione modello di dati aziendali nel modello HD.

Modello di dati aziendali

Come risolvere il problema della trasformazione modello di dati aziendali nel modello HD? Per risolvere questo problema, è necessario disporre di questo modello, ad es. modello di dati aziendali dovrebbe essere costruito e documentato... E devi capire che cosa da questo modello e come dovrebbe essere trasformato nel modello HD.

Chiariamo il concetto dal punto di vista di un progettista di CD modello di dati aziendali. Sotto modello di dati aziendali comprendere la descrizione strutturata e stratificata dei domini di un'organizzazione, delle strutture dei dati del dominio, dei processi e delle procedure aziendali, dei flussi di dati dell'organizzazione, dei diagrammi di stato, delle matrici dei processi di dati e di altre rappresentazioni del modello utilizzate nelle attività dell'organizzazione. Quindi, nel senso ampio del termine, modello di dati aziendali è un insieme di modelli di vari livelli che caratterizzano (modello a un certo livello astratto) le attività di un'organizzazione, ad es. soddisfare modello aziendale dipende direttamente da quali costruzioni di modello sono state incluse in esso in una data organizzazione.

Gli elementi principali modello di dati aziendali siamo:

descrizione delle aree tematiche dell'organizzazione (definizione delle aree di attività);
rapporti tra le aree tematiche sopra definite;
modello di dati informativi (modello ERD o modello "relazione entità");
descrizione per ogni area tematica:
- chiavi di entità;
- attributi di entità;
- sottotipi e supertipi;
- relazioni tra entità;
- attributi di raggruppamento;
- relazioni tra aree disciplinari;
modello di processo funzionale o aziendale;
diagrammi di flusso di dati;
diagrammi di stato;
altri modelli.

Quindi, modello di dati aziendali contiene entità, attributi e relazioni che rappresentano le esigenze di informazione di un'organizzazione. Nella fig. 16.1 mostra gli elementi principali modello di dati aziendali.

Livelli di presentazione del modello di dati aziendali

Modello di dati aziendali suddivise per aree tematiche, che rappresentano gruppi di entità rilevanti a supporto di specifiche esigenze aziendali. Alcune aree tematiche possono coprire funzioni aziendali specifiche, come la gestione dei contratti, mentre altre possono includere entità che descrivono prodotti o servizi.

Ogni modello logico deve corrispondere al dominio esistente modello di dati aziendali... Se il modello logico non soddisfa questo requisito, è necessario aggiungervi un modello di dominio.

Modello di dati aziendali di solito ha diversi livelli di presentazione. Infatti alto livello (alto livello) modello di dati aziendali c'è una descrizione delle principali aree tematiche dell'organizzazione e delle loro relazioni a livello di entità. Nella fig. 16.2 è uno snippet modello di dati aziendali livello superiore.

Figura: 16.2.

Il diagramma mostrato in figura rappresenta quattro aree tematiche: "Acquirente" ( Cliente), "Punto" ( account), "Ordine" ( Ordine) e "Prodotto" ( Prodotto). Di regola, solo collegamenti diretti tra aree tematiche, che, ad esempio, registrano il seguente fatto: l'acquirente paga la fattura per l'ordine di merce. Dettagli e relazioni indirette a questo livello modello aziendale non mostrato.

Nella prossima, livello intermedio (livello medio) modello di dati aziendali vengono visualizzate informazioni dettagliate sugli oggetti delle aree tematiche, ad es. tasti e attributi di entità, le loro relazioni, sottotipi e supertipi, ecc. Per ogni dominio del modello di primo livello, esiste un modello di livello intermedio. Nella fig. 16.3 mostra il livello medio di presentazione modello aziendale per un frammento dell'area tematica "Ordine".

Figura. 16.3 si può vedere che l'area tematica "Ordine" ( Ordine) include diverse entità, definite tramite i loro attributi e le relazioni tra loro. Il modello presentato consente di rispondere a domande come la data dell'ordine, chi ha effettuato l'ordine, chi ha inviato l'ordine, chi riceve l'ordine e una serie di altri. Dal diagramma sopra, si può vedere che in questa organizzazione ci sono due tipi di ordini: ordini per una promozione ( Commerciale) e ordini al dettaglio ( Al dettaglio).

notare che modello di dati aziendali può rappresentare vari aspetti delle attività dell'organizzazione e con diversi gradi di dettaglio e completezza. Se una modello aziendale rappresenta tutti gli aspetti delle attività dell'organizzazione, viene anche chiamato modello di dati dell'organizzazione (modello di dati aziendali).

Dal punto di vista del design HD, un fattore importante nella decisione di creare un modello HD modello di dati aziendali è lo stato completezza modello di dati aziendali.

Modello di dati aziendali l'organizzazione ha la caratteristica dell'evoluzione, cioè è in costante sviluppo e miglioramento. Alcune aree tematiche modello di dati aziendali potrebbe essere ben sviluppato, per alcuni il lavoro potrebbe non essere ancora iniziato. Se un frammento dell'area tematica non è stato elaborato in modello di dati aziendali, quindi non c'è modo di utilizzare questo modello come punto di partenza per la progettazione di un CD.

Grado di completamento modello aziendale può essere livellato nel design del CD come segue. Poiché il processo di sviluppo del CD è solitamente suddiviso nel tempo in una sequenza di fasi, è possibile sincronizzarne il processo di progettazione processo di completamento sviluppo di singoli frammenti modello di dati aziendali organizzazioni.

Al minimo livello di presentazione del modello di dati aziendali informazioni sulle caratteristiche fisiche degli oggetti del database corrispondenti a modello logico dei dati mezzo livello di presentazione del modello di dati aziendali.

Il database aziendale è l'anello centrale del sistema informativo aziendale e consente di creare un unico spazio informativo per l'azienda. Database aziendali

Condividi il tuo lavoro sui social media

Se questo lavoro non ti soddisfa in fondo alla pagina c'è un elenco di lavori simili. Puoi anche usare il pulsante di ricerca

PAGINA 15

ARGOMENTO V. DATABASE AZIENDALI

CONFERENZA 8

V .1. Organizzazione dei dati nei sistemi aziendali. Database aziendali.

V .2. DBMS e soluzioni strutturali nei sistemi aziendali.

V .3. Tecnologie Internet / Intranet e soluzioni aziendali per l'accesso al database.

V .1. ORGANIZZAZIONE DEI DATI NEI SISTEMI AZIENDALI. DATABASE AZIENDALI

Base aziendale i dati sono l'anello centrale del sistema informativo aziendale e consentono di creare un unico spazio informativo per l'azienda. Database aziendali (Figura 1.1).

Esistono varie definizioni di database.

Sotto il database (DB) comprendere un insieme di informazioni collegate logicamente in modo tale da costituire un unico insieme di dati archiviati nei dispositivi di memoria di un computer. Questo set funge da dati iniziali dei compiti risolti nel processo di funzionamento di sistemi di controllo automatizzati, sistemi di elaborazione dati, informazioni e sistemi informatici.

Il termine database può essere brevemente formulato come una raccolta di dati logicamente correlati destinati alla condivisione.

Sotto il database è inteso come un insieme di dati immagazzinati insieme ad una ridondanza così minima che ne consente l'utilizzo in maniera ottimale per una o più applicazioni.

Lo scopo della creazione di database come forme di archiviazione dei dati costruzione di un sistema di dati che non dipende dagli algoritmi adottati (software), dai mezzi tecnici utilizzati, dalla posizione fisica dei dati nel computer. Il database presuppone un utilizzo polivalente (più utenti, molte forme di documenti e richieste di un utente).

Requisiti di base per i database:

Completezza della presentazione dei dati. I dati nella banca dati dovrebbero rappresentare adeguatamente tutte le informazioni sull'oggetto e dovrebbero essere sufficienti per ODS.
Integrità del database. I dati devono essere salvati durante l'elaborazione della loro ODS e in tutte le situazioni che si verificano durante il lavoro.
Flessibilità della struttura dei dati. Il database dovrebbe consentire la modifica delle strutture dei dati senza violare la sua integrità e completezza quando cambiano le condizioni esterne.
Fattibilità. Ciò significa che deve esserci una rappresentazione oggettiva dei vari oggetti, delle loro proprietà e relazioni.
Disponibilità. È necessario garantire la delimitazione dell'accesso ai dati.
Ridondanza. Il database dovrebbe avere una ridondanza minima nella rappresentazione dei dati su qualsiasi oggetto.

Conoscenza significa una serie di fatti, modelli e regole euristiche che possono essere utilizzate per risolvere il problema.

Base di conoscenza (KB)  una serie di database e regole utilizzate ottenute dai decisori. La knowledge base è un elemento dei sistemi esperti.

Distinguerediversi modi di presentare i dati.

Dati fisici -si tratta di dati archiviati nella memoria del computer.

Rappresentazione logica dei daticorrisponde a una visualizzazione personalizzata dei dati fisici. La differenza tra rappresentazioni fisiche e corrispondenti logiche dei dati è che quest'ultima riflette alcune importanti relazioni tra i dati fisici.

Sotto il database aziendale comprendere un database che riunisce in una forma o nell'altra tutti i dati e le conoscenze necessarie sull'organizzazione da automatizzare. Nei sistemi informativi aziendali, un concetto comedatabase integrati, in cui viene implementato il principio del singolo input e dell'uso ripetuto delle informazioni.

Figura: 1.1. La struttura dell'interazione dei reparti con le risorse informative della società.

I database aziendali lo sonofocalizzata (centralizzato) e distribuito.

Focalizzato (centralizzato)banca dati è un database i cui dati sono fisicamente memorizzati nei dispositivi di archiviazione di un computer. Nella fig. 1.2 presenta un diagramma di un'applicazione server per l'accesso ai database in varie piattaforme.

Figura 1.2. Schema eterogeneo database centralizzato

La centralizzazione dell'elaborazione delle informazioni ha consentito di eliminare gli svantaggi dei file system tradizionali come l'incoerenza, l'incoerenza e la ridondanza dei dati. Tuttavia, con la crescita dei database, e specialmente se utilizzati in organizzazioni geograficamente disperse, sorgono problemi. Ad esempio, per database concentrati situati nel nodo di una rete di telecomunicazioni, con l'aiuto dei quali vari dipartimenti dell'organizzazione accedono ai dati, con la crescita del volume di informazioni e del numero di transazioni, sorgono le seguenti difficoltà:

Ampio flusso di scambio di dati;
Elevato traffico sulla rete;
Bassa affidabilità;
Scarse prestazioni complessive.

Sebbene sia più facile garantire la sicurezza, l'integrità e la coerenza delle informazioni durante gli aggiornamenti in un database concentrato, questi problemi pongono alcune sfide. La decentralizzazione dei dati si propone come possibile soluzione a questi problemi. Il decentramento realizza:

Grado più elevato di simultaneità di elaborazione dovuto al bilanciamento del carico;
Miglioramento dell'uso dei dati sul campo durante l'esecuzione di query remote (remote);
Costi inferiori;
Facilità di gestione dei database locali.

I costi di creazione di una rete nei nodi di cui si trovano le workstation (piccoli computer) sono molto inferiori ai costi di creazione di un sistema simile utilizzando un computer di grandi dimensioni. La Figura 1.3 mostra il diagramma logico di un database distribuito.

Figura 1.3. Database aziendale distribuito.

Diamo la seguente definizione di database distribuito.

Database distribuito -è una raccolta di informazioni, file (relazioni) immagazzinati in diversi nodi della rete informativa e connessi logicamente in modo tale da costituire un unico insieme di dati (la comunicazione può essere funzionale o tramite copie dello stesso file). Quindi, è un insieme di database collegati logicamente, ma fisicamente situati su più macchine che fanno parte della stessa rete di computer.

I requisiti di prestazioni più importanti per un database distribuito sono:

Scalabilità;
Compatibilità;
Supporto per vari modelli di dati;
Portabilità;
Trasparenza della posizione;
Autonomia dei nodi database distribuiti (Site Autonomy);
Elaborazione distribuita delle richieste;
Esecuzione di transazioni distribuite.
Supporto per un sistema di sicurezza omogeneo.

La trasparenza della posizione consente agli utenti di interagire con i database senza sapere nulla sulla loro posizione. L'autonomia dei nodi in un database distribuito significa che ogni database può essere mantenuto indipendentemente dagli altri. Una query distribuita è una query (istruzione SQL), durante l'esecuzione di quali oggetti (tabelle o viste) di diversi database si accede. Quando si eseguono transazioni distribuite, viene eseguito il controllo della concorrenza di tutti i database coinvolti. Oracle7 utilizza la tecnologia di trasferimento delle informazioni in due fasi per eseguire transazioni distribuite.

I database che compongono un database distribuito non devono essere omogenei (cioè essere mantenuti da un DBMS) o elaborati nell'ambiente dello stesso sistema operativo e / o su computer dello stesso tipo. Ad esempio, un database può essere un database Oracle su una macchina SUN che esegue SUN OS (UNIX), un secondo database può essere ospitato da un database DB2 su un mainframe IBM 3090 con un sistema operativo MVS e un terzo database può essere eseguito da SQL / DS anche su il mainframe IBM, ma con il sistema operativo VM. È richiesta una sola condizione: tutte le macchine con database devono essere accessibili sulla rete di cui fanno parte.

Il compito principale di un database distribuito - distribuzione dei dati sulla rete e fornitura dell'accesso ad essi. Esistono i seguenti modi per risolvere questo problema:

Ogni nodo archivia e utilizza il proprio set di dati disponibile per le query remote. Questa distribuzione è divisa.
Alcuni dati utilizzati di frequente nei siti remoti potrebbero essere duplicati. Questa distribuzione è chiamata parzialmente duplicata.
Tutti i dati vengono duplicati in ogni nodo. Questa distribuzione è chiamata completamente duplicata.
Alcuni file possono essere divisi orizzontalmente (viene selezionato un sottoinsieme di record) o verticalmente (viene selezionato un sottoinsieme di campi attributo), mentre i sottoinsiemi selezionati vengono memorizzati in nodi diversi insieme ai dati non suddivisi. Questa distribuzione è chiamata split (frammentata).

Quando si crea un database distribuito a livello concettuale, è necessario risolvere le seguenti attività:

È necessario disporre di un unico diagramma concettuale dell'intera rete. Ciò fornirà una trasparenza logica dei dati per l'utente, a seguito della quale potrà formulare una richiesta all'intero database, essendo dietro un terminale separato (sembra funzionare con un database centralizzato).
È necessario uno schema per individuare i dati sulla rete. Ciò garantirà la trasparenza del posizionamento dei dati, grazie alla quale l'utente non dovrà specificare dove inviare la richiesta per ottenere i dati richiesti.
È necessario risolvere il problema dell'eterogeneità dei database distribuiti. I database distribuiti possono essere omogenei o eterogenei in termini di hardware e software. Il problema dell'eterogeneità è relativamente facile da risolvere se il database distribuito è eterogeneo nel senso di hardware, ma omogeneo nel senso di software (lo stesso DBMS nei nodi). Se vengono utilizzati DBMS diversi nei nodi di un sistema distribuito, sono necessari mezzi per trasformare le strutture di dati e i linguaggi. Ciò dovrebbe fornire trasparenza della trasformazione tra i nodi del database distribuito.
È necessario affrontare il problema della gestione del dizionario. Per fornire tutti i tipi di trasparenza in un database distribuito, sono necessari programmi che gestiscano più dizionari e libri di riferimento.
È necessario definire metodi per eseguire query in un database distribuito. I metodi per eseguire le query in un database distribuito differiscono da quelli in un database centralizzato, poiché le singole parti delle query devono essere eseguite nella posizione dei dati corrispondenti e i risultati parziali devono essere passati ad altri nodi; allo stesso tempo, deve essere garantito il coordinamento di tutti i processi.
È necessario risolvere il problema dell'esecuzione di query parallele. In un database distribuito, è necessario un complesso meccanismo di controllo della concorrenza, che, in particolare, deve garantire la sincronizzazione quando le informazioni vengono aggiornate, il che garantisce la coerenza dei dati.
È necessaria una metodologia sviluppata per la distribuzione e il posizionamento dei dati, inclusa la suddivisione, è uno dei requisiti principali per un database distribuito.

Una delle nuove aree in via di sviluppo dell'architettura dei sistemi informatici, che è un potente strumento per l'elaborazione delle informazioni non numeriche, sonomacchine database... Le macchine database vengono utilizzate per risolvere attività non numeriche come memorizzare, cercare e trasformare documenti e fatti e lavorare con oggetti. Seguendo la definizione di dati come informazioni digitali e grafiche sugli oggetti del mondo circostante, diversi contenuti sono incorporati nel concetto di dati nell'elaborazione numerica e non numerica. L'elaborazione numerica utilizza oggetti come variabili, vettori, matrici, array multidimensionali, costanti e così via, mentre l'elaborazione non numerica utilizza oggetti come file, record, campi, gerarchie, reti, relazioni e così via. l'elaborazione non numerica è interessata direttamente alle informazioni sugli oggetti (ad esempio, un dipendente specifico o un gruppo di dipendenti) e non nel file dei dipendenti in quanto tale. Il file dei dipendenti non è indicizzato qui per selezionare una persona specifica; qui il contenuto della voce desiderata è più interessante. Grandi quantità di informazioni sono solitamente soggette a elaborazione non numerica. In varie applicazioni è possibile eseguire, ad esempio, le seguenti operazioni su questi dati:

aumentare lo stipendio di tutti i dipendenti dell'azienda;
calcolare gli interessi bancari sui conti di tutti i clienti;
apportare modifiche all'elenco di tutte le merci in magazzino;
trovare l'abstract richiesto da tutti i testi archiviati nella biblioteca o nel sistema di recupero delle informazioni bibliografiche;
trovare una descrizione del contratto richiesto in un file contenente documenti legali;
sfoglia tutti i file contenenti descrizioni di brevetti e trova di nuovo un brevetto (se presente) simile a quello proposto.

Per implementare il motore di database,parallelo e associativo architettura come alternativa al singolo processorevon Neumann struttura, permettendo di lavorare con grandi quantità di informazioni in tempo reale.

Le macchine database stanno acquisendo importanza in relazione alla ricerca e all'applicazione di concetti di intelligenza artificiale come rappresentazione della conoscenza, sistemi esperti, inferenza, riconoscimento di modelli, ecc.

Archivi di informazioni. Oggi, molti ammettono che già ora la maggior parte delle aziende gestisce diversi database e, per lavorare con successo con le informazioni, non sono necessari solo diversi tipi di database, ma diverse generazioni di DBMS. Secondo le statistiche, ogni organizzazione utilizza in media 2,5 diversi DBMS. È diventata evidente la necessità di "isolare" l'attività delle aziende, o meglio, le persone coinvolte in questa attività, dalle caratteristiche tecnologiche dei database, per fornire agli utenti una visione unica delle informazioni aziendali indipendentemente da dove siano fisicamente archiviate. Ciò ha stimolato l'emergere della tecnologia di archiviazione delle informazioni (Data Warehousing, DW).

Lo scopo principale di DW ècreazione di un'unica presentazione logica dei dati contenuti in diverse tipologie di database, o, in altre parole, un unico modello dati aziendale.

Un nuovo ciclo di sviluppo DW è diventato possibile grazie al miglioramento delle tecnologie dell'informazione in generale, in particolare, all'emergere di nuovi tipi di database basati sull'elaborazione di query parallele, che a loro volta si basavano sui progressi dei computer paralleli. Furono creaticostruttori di query con un'interfaccia grafica intuitiva, che ha semplificato la creazione di query di database complesse. Vari softwarestrato intermedio (midleware) comunicazione fornitatra diversi tipi di database, e alla fine cadde bruscamentedispositivi di memoria.

La struttura della società può contenere Banca dati.

Banca dati - componente funzionale e organizzativa in sistemi di controllo automatizzati e sistemi informativi e informatici, fornendo supporto informativo centralizzato per un gruppo di utenti o una serie di compiti risolti nel sistema.

Banca dati è considerato un sistema informativo e di riferimento, il cui scopo principale è:

nell'accumulo e nel mantenimento in ordine di funzionamento di un insieme di informazioni che costituisce la base informativa dell'intero sistema automatizzato o di un certo insieme di compiti in esso risolti;
nel rilascio dei dati richiesti dall'incarico o dall'utente;
nel fornire accesso collettivo alle informazioni archiviate;
nel garantire la necessaria gestione dell'utilizzo delle informazioni contenute nella base informativa.

Pertanto, una banca dati moderna è un complesso software e hardware complesso, che include strumenti tecnici, di sistema e di rete, database e DBMS, sistemi di recupero delle informazioni per vari scopi.

V .2. DBMS E SOLUZIONI STRUTTURALI NEI SISTEMI AZIENDALI

Database e sistemi di gestione della conoscenza

Una componente importante dei moderni sistemi informativi sono i sistemi di gestione dei database (DBMS).

DBMS - una serie di software e strumenti linguistici progettati per creare, mantenere e utilizzare database.

Il sistema di gestione del database fornisce l'accesso dei sistemi di elaborazione dei dati ai database. Come già notato, i DBMS acquisiscono un ruolo importante nella creazione di sistemi informativi aziendali e, un ruolo particolarmente importante, nella creazione di sistemi informativi utilizzando risorse informative distribuite basate sulle moderne tecnologie informatiche di rete.

La caratteristica principale dei DBMS moderni è che i DBMS moderni supportano talitecnologie come:

Tecnologia client / server.
Supporto delle lingue del database. essolinguaggio di definizione dello schema DB (SDL - Schema Definition Language),data Manipulation Language (DML), linguaggi integratiSQL (Structured Queue Language), QDB (Query - By - Example) e QMF (Query Management Facility ) È una specifica di query periferica avanzata e uno strumento di reporting perDB 2, ecc.;
Gestione diretta dei dati nella memoria esterna.
Gestione dei buffer RAM.
Gestione delle transazioni. OLTP - tecnologia (Elaborazione transazioni in linea), OLAP -tecnologia (Elaborazione analisi in linea)per DW.
Garantire la protezione e l'integrità dei dati. L'utilizzo del sistema è consentito solo agli utenti che hanno facoltà di accedere ai dati. Quando gli utenti eseguono operazioni sui dati, viene mantenuta la coerenza dei dati memorizzati (integrità). Questo è importante nei sistemi informativi multiutente aziendali.
Giornalizzazione.

Il DBMS moderno deve garantire che i requisiti del database sopra elencati siano soddisfatti. Inoltre, devono soddisfare i seguenti principi:

Indipendenza dai dati.
Versatilità. Il DBMS deve disporre di un potente supporto del modello di dati concettuale per la visualizzazione di viste logiche personalizzate.
Compatibilità. Il DBMS deve rimanere operativo con lo sviluppo di software e hardware.
Ridondanza dei dati. A differenza dei file system, un database deve essere una singola raccolta di dati integrati.
Protezione dati. Il DBMS deve fornire protezione contro l'accesso non autorizzato.
Integrità dei dati. Il DBMS deve impedire agli utenti di danneggiare il database.
Gestione del lavoro simultaneo. Il DBMS deve proteggere il database da incoerenze nella modalità di accesso condiviso. Per garantire uno stato coerente del database, tutte le richieste degli utenti (transazioni) devono essere eseguite in un ordine specifico.
Il DBMS deve essere universale. Dovrebbe supportare diversi modelli di dati su un'unica base logica e fisica.
Il DBMS deve supportare database centralizzati e distribuiti e, quindi, diventare un collegamento importante nelle reti di computer.

Considerando un DBMS come una classe di prodotti software volti a mantenere i database in sistemi automatizzati, possiamo individuare due caratteristiche essenziali che determinano i tipi di DBMS. Secondo loro, un DBMS può essere visualizzato da due punti di vista:

le loro capacità in relazione ai database (aziendali) distribuiti;
la loro relazione con il tipo di modello di dati implementato nel DBMS.

In relazione ai database aziendali (distribuiti), è possibile distinguere convenzionalmente i seguenti tipi di DBMS:

DBMS "desktop". Questi prodotti si concentrano principalmente sull'utilizzo di dati personali (dati "desktop"). Hanno set di comandi per la condivisione di database comuni, ma di piccole dimensioni (come un piccolo ufficio). Prima di tutto, è un DBMS come Assess, dBASE, Paradox, EohPgo. Perché Assess, dBASE, Paradox, EohPgo hanno scarso accesso ai dati aziendali. Il punto è che non esiste un modo semplice per superare la barriera tra i dati personali e quelli aziendali. E il punto non è nemmeno che il meccanismo del DBMS di dati personali (o piccolo ufficio) è focalizzato sull'accesso ai dati attraverso molti gateway, prodotti di internetworking, ecc. Il problema è che questi meccanismi sono solitamente associati a trasferimenti di file completi e alla mancanza di supporto per l'indice forkato, con il risultato che le code dei server praticamente smettono di funzionare su sistemi di grandi dimensioni.
DBMS multiutente ad alte prestazioni specializzato. Tali DBMS sono caratterizzati dalla presenza di un kernel di sistema multiutente, un linguaggio di manipolazione dei dati e le seguenti funzioni tipiche dei DBMS multiutente sviluppati:
organizzazione del buffer pool;
la presenza di un sistema per l'elaborazione di code di transazioni;
la presenza di meccanismi per il blocco dei dati multiutente;
registrazione delle transazioni;
la disponibilità di meccanismi di controllo degli accessi.

Questi sono DBMS come Oracle, DB2, SQL / Server, Informix, Sybase, ADABAS, Titanium e altri forniscono un ampio servizio per l'elaborazione dei database aziendali.

Quando si lavora con i database, viene utilizzato il meccanismo di transazione.

Transazione È un'unità logica di lavoro.

Transazione è una sequenza di istruzioni di manipolazione dei dati eseguitenel complesso (tutto o niente) e la traduzione del databaseda uno stato olistico a un altro stato olistico.

Ci sono quattro importanti proprietà di una transazione nota comeproprietà ASID:

(A) Atomicità ... Una transazione viene eseguita come un'operazione atomica: viene eseguita l'intera transazione o non viene eseguita interamente.
(C) Coerenza... Una transazione sposta un database da uno stato coerente (coerente) a un altro stato coerente (coerente). All'interno di una transazione, la coerenza del database può essere violata.
(I) Isolamento ... Le transazioni di utenti diversi non devono interferire tra loro (ad esempio, come se fossero eseguite rigorosamente a turno).
(E) Durabilità... Se la transazione è completata, i risultati del suo lavoro dovrebbero essere salvati nel database, anche se il momento successivo il sistema si blocca.

La transazione di solito inizia automaticamente dal momento in cui l'utente si connette al DBMS e continua fino a quando non si verifica uno dei seguenti eventi:

Emesso il comando COMMIT WORK.
È stato emesso un comando ROLLBACK WORK.
L'utente è stato disconnesso dal DBMS.
Si è verificato un guasto del sistema.

Per l'utente, di solito indossacarattere atomico... In realtà, questo è un meccanismo complesso di interazione utente (applicazione) - database. Il software dei sistemi aziendali utilizza un motore di elaborazione delle transazioni in tempo reale (Sistemi di elaborazione delle transazioni in linea, OLTP), in particolare software di contabilità, software per la ricezione e l'elaborazione degli ordini dei clienti, applicazioni finanziarie, producono molte informazioni. Questi sistemi sono progettati (e opportunamente ottimizzati) per gestire grandi quantità di dati, transazioni complesse e operazioni di lettura / scrittura intense.

Sfortunatamente, le informazioni inserite nei database dei sistemi OLTP non sono molto adatte all'uso da parte degli utenti ordinari (a causa dell'alto grado di normalizzazione delle tabelle, formati di presentazione dei dati specifici e altri fattori). Pertanto, i dati provenienti da diverse pipeline di informazioni vengono inviati (nel senso di essere copiati) amagazzino di stoccaggio, smistamento e successiva consegna al consumatore. Nella tecnologia dell'informazione, il ruolo dei magazzini è svolto daarchivi di informazioni.

Consegna delle informazioni all'utente finale - sistemi di elaborazione dati analitici in tempo reale(Elaborazione analitica in linea, OLAP)che forniscono un accesso estremamente semplice ai dati attraverso mezzi convenienti per generare query e analizzare i risultati. Nei sistemi OLAP, il valore di un prodotto informativo aumenta grazie all'utilizzo di vari metodi di analisi ed elaborazione statistica. Inoltre, questi sistemi sono ottimizzati in termini di velocità di estrazione dei dati, raccolta di informazioni generalizzate e sono rivolti agli utenti ordinari (hanno un'interfaccia intuitiva). Se unaSistema OLTP dà risposte a semplici domande come "qual era il livello delle vendite del prodotto N nella regione M nel gennaio 199x?", quindiSistemi OLAP pronto per le query degli utenti più complesse, ad esempio: "Fornire un'analisi delle vendite del prodotto N in tutte le regioni secondo il piano per il secondo trimestre rispetto ai due anni precedenti".

Architettura client / server

Nei sistemi modernielaborazione delle informazioni distribuite, la tecnologia è al centro della scenaclient / server. Nel sistema architettura client-server l'elaborazione dei dati è suddivisa tra il computer client e il computer server, la comunicazione tra i quali avviene attraverso la rete. Questa separazione dell'elaborazione dei dati si basa sul raggruppamento delle funzioni. In genere, un computer server di database è dedicato all'esecuzione di operazioni di database e un computer client esegue programmi applicativi. La Figura 2.1 mostra un semplice sistema di architettura client-server che include un computer che funge da server e un altro computer che funge da client. Ogni macchina svolge funzioni diverse e dispone delle proprie risorse.

server		Banca dati
Computer server
Netto
PC compatibile IBM	PC compatibile IBM	PC compatibile IBM
Clienti		Applicazioni

Figura: 2.1. Sistema di architettura client-server

La funzione principale del computer client è eseguire l'applicazione (interfaccia utente e logica di presentazione) e comunicare con il server quando richiesto dall'applicazione.

server - è un oggetto (computer) che fornisce servizi ad altri oggetti su loro richiesta.

Come risulta dal termine stesso, la funzione principale del computer server è quella di soddisfare le esigenze del cliente. Il termine "Server" viene utilizzato per fare riferimento a due diversi gruppi di funzioni: file server e database server (di seguito, questi termini indicano, a seconda del contesto, software che implementa i gruppi di funzioni specificati o computer con questo software). I file server non sono progettati per eseguire operazioni con i database, la loro funzione principale è quella di condividere file tra più utenti, ad es. fornire l'accesso simultaneo di molti utenti ai file sul computer - file server. Un esempio di file server è il sistema operativo NetWare di Novell. Il server database può essere installato e gestito su un computer file server. Oracle DBMS sotto forma di NLM (Network Loadable Module) viene eseguito nell'ambiente NetWare sul file server.

Il server di rete locale deve disporre delle risorse corrispondenti al suo scopo funzionale e alle esigenze della rete. Si noti che a causa della focalizzazione sull'approccio dei sistemi aperti, è più corretto parlare di server logici (ovvero un insieme di risorse e software che forniscono servizi su queste risorse), che non si trovano necessariamente su computer diversi. Una caratteristica di un server logico in un sistema aperto è che se, per ragioni di efficienza, è consigliabile spostare il server su un computer separato, allora questo può essere fatto senza la necessità di alcuna modifica, sia di se stesso che delle applicazioni che lo utilizzano.

Uno dei requisiti importanti del server è che il sistema operativo che ospita il server del database deve essere multitasking (e preferibilmente, ma non necessariamente, multiutente). Ad esempio, un DBMS Oracle installato su un personal computer con un sistema operativo MS-DOS (o PC-DOS) che non soddisfa i requisiti di multitasking non può essere utilizzato come server database. E lo stesso Oracle DBMS installato su un computer con un sistema operativo OS / 2 multitasking (sebbene non multiutente) può essere un server di database. Molte versioni di UNIX, MVS, VM e alcuni altri sistemi operativi sono sia multitasking che multiutente.

Calcolo distribuito

Il termine "calcolo distribuito" è spesso usato per riferirsi a due concetti diversi, sebbene complementari:

Database distribuito;
Elaborazione dati distribuita.

L'applicazione di questi concetti consente di organizzare l'accesso alle informazioni archiviate su più macchine per gli utenti finali utilizzando mezzi diversi.

Esistono molti tipi di server:

Server di database;
Server di stampa;
Server di accesso remoto;
Server fax;
Web server, ecc.

Al centro della tecnologia sottostante c'è il client / server sono tecnologie di base come:

Tecnologie del sistema operativo, concetto di interazione di sistemi aperti, creazione di ambienti orientati agli oggetti per il funzionamento dei programmi;
Tecnologie di telecomunicazione;
Tecnologie di rete;
Tecnologie di interfaccia utente grafica (GUI);
Eccetera.

Vantaggi della tecnologia client-server:

La tecnologia client / server consente di eseguire calcoli su ambienti di elaborazione eterogenei. Indipendenza dalla piattaforma: accesso ad ambienti di rete eterogenei che includono diversi tipi di computer con diversi sistemi operativi.
Indipendenza da fonti di dati: accesso alle informazioni da database eterogenei. Esempi di tali sistemi sono DB2, SQL / DS, Oracle, Sybase.
Bilanciamento del carico tra client e server.
Eseguire il calcolo dove è più efficiente;
Fornire scalabilità efficiente;
Elaborazione multipiattaforma... Il cross-platform computing è semplicemente definito come l'implementazione di tecnologie in ambienti informatici eterogenei. Qui dovrebbero essere fornite le seguenti possibilità:
L'applicazione deve essere eseguita su più piattaforme;
Dovrebbe avere la stessa interfaccia e logica su tutte le piattaforme;
L'applicazione deve integrarsi con l'ambiente operativo nativo;
Dovrebbe comportarsi allo stesso modo su tutte le piattaforme;
Dovrebbe essere fornito con un supporto semplice e coerente.

 Calcolo distribuito. Il calcolo distribuito implica la distribuzione del lavoro tra diversi computer (sebbene il calcolo distribuito sia un concetto più ampio).

 Ridimensionamento. Unbundling è il trasferimento di applicazioni mainframe su piccole piattaforme di computer.

Riduzione dei costi di infrastruttura e hardware. Economico: la disponibilità di apparecchiature informatiche poco costose e la crescente proliferazione di reti locali rendono la tecnologia client-server più economica di altre tecnologie di elaborazione dati. L'attrezzatura può essere aggiornata non appena se ne presenta la necessità.

 Riduzione del tempo di esecuzione complessivo dell'applicazione;

 Riduzione dell'utilizzo della memoria del client;

 Riduzione del traffico di rete.

Capacità di lavorare con la multimedialità: ad oggi sono stati realizzati molti programmi multimediali per PC. Non esistono tali programmi per la configurazione terminal-host, oppure sono molto costosi.
La capacità di attrarre grandi risorse di elaborazione per le operazioni del database: poiché le applicazioni vengono eseguite sui computer client, risorse aggiuntive (rispetto alla configurazione host del terminale) sul computer server vengono liberate per le operazioni del database, come le risorse di elaborazione della CPU e le risorse operative memoria.
Maggiore produttività del programmatore: la produttività del programmatore viene aumentata utilizzando strumenti come SQL * Forms e CASE, che consentono di sviluppare applicazioni più rapidamente rispetto ai linguaggi di programmazione come C, PL1 o COBOL.
Maggiore produttività per gli utenti finali: ormai molti utenti finali hanno imparato a padroneggiare sistemi come Lotus, Paradox, Word Perfect, Harvard Graphics e altri.

L'interfaccia lato server è definita e fissa. Pertanto, è possibile creare nuove parti client di un sistema esistente (un esempio di interoperabilità a livello di sistema).

Figura: 2.2. Illustrazione dell'accesso del client a una condivisione del server.

Come implementare la tecnologia client-server

La discussione seguente discute l'installazione di un sistema basato sulla tecnologia client-server e in grado di eseguire l'elaborazione distribuita dei dati. È richiesto il seguente hardware e software per computer:

computer server di database;
computer client;
rete di comunicazione;
software di rete;
software applicativo.

Linguaggio SQL ... Linguaggio di query di alto livello -SQL (Structured Query Language ) serve per implementare query a database, come YAMD, YOD e PNP ed è adottato come standard. LinguaSQL è stato originariamente adottato come linguaggio dei dati dei prodotti software dell'aziendaIBM e DBMS relazionali YAMDSYSTEM R di IBM ... Una caratteristica importante della linguaSQL è che lo stesso linguaggio viene presentato attraverso due diverse interfacce, ovvero attraverso un'interfaccia interattiva e attraverso un'interfaccia di programmazione dell'applicazione (dynamicSQL). SQL dinamico consiste in molte funzionalità linguistiche incorporateSQL , previsto specificamente per la costruzione di applicazioni interattive, dove un'applicazione interattiva è intesa come un programma scritto per supportare l'accesso al database dell'utente finale che lavora sul terminale interattivo. LinguaSQL fornisce le funzioni di definizione, manipolazione e gestione dei dati del database ed è trasparente per l'utente dal punto di vista del DBMS implementato.

Figura: 2.3. Schema per l'esecuzione di query utente su database distribuiti.

La struttura interna dei database è determinata dai modelli di dati utilizzati. Il modello concettuale ha maggiori capacità di astrazione e una semantica più ricca rispetto ai modelli esterni. I modelli esterni sono spesso indicati come modelli sintattici o operativi, in riferimento alla natura sintattica del controllo e dell'uso come mezzo di interazione dell'utente con il database. In Information Modeling, ci sono vari livelli di astrazione, dal modello concettuale al modello fisico dei dati, che influenzano l'architettura del DBMS.

Il modello di dati ha tre componenti:

La struttura dei dati da rappresentare dal punto di vista dell'utente del database.
Operazioni valide eseguite sulla struttura dati. È necessario essere in grado di lavorare con questa struttura con l'aiuto di varie operazioni NOD e NMD. Una struttura ricca è inutile se non c'è modo di manipolarne il contenuto.
Vincoli di controllo dell'integrità. Il modello di dati dovrebbe essere dotato dei mezzi per mantenerne l'integrità e proteggerlo. Ad esempio, considera i seguenti due vincoli:
Ogni sottostruttura deve avere un nodo di origine. I database gerarchici non possono archiviare nodi figlio senza un nodo di origine.
Per quanto riguarda un database relazionale, non possono esserci tuple identiche. Per un file, questo requisito richiede che tutti i record siano univoci.

Una delle caratteristiche più importanti di un DBMS è la capacità di collegare oggetti.

Esistono i seguenti tipi di collegamenti tra oggetti:

Uno a uno (1: 1)... Un oggetto di un set può essere associato a un oggetto di un altro set.
Uno-a-molti (1: M)... Un oggetto di un set può essere associato a molti oggetti di un altro set.
Molti-a-molti (M: N)... Un oggetto di un insieme può essere associato a molti oggetti di un altro insieme, ma un oggetto di un altro insieme può essere associato a molti oggetti del primo insieme.
Ramificato ... Un oggetto di un set può essere associato a oggetti di molti set.
Ricorsivo ... Un oggetto di un dato insieme può essere collegato da un oggetto dello stesso insieme.

Esistono i seguenti modelli di dati principali:

Modello di dati relazionali.
Modello di dati gerarchico.
Modello di dati di rete incompleto.
Modello dati CODASYL.
Modello di dati di rete esteso.

V .3. TECNOLOGIE INTERNET / INTRANET E SOLUZIONI AZIENDALI SULL'ACCESSO AI DATABASE

Il problema principale dei sistemi basati su architettura client-server è che, in accordo con il concetto di sistemi aperti, devono essere mobili nella più ampia classe possibile di soluzioni hardware e software di sistemi aperti. Anche se ci limitiamo alle reti locali basate su UNIX, reti diverse utilizzano apparecchiature e protocolli di comunicazione diversi. I tentativi di creare sistemi che supportano tutti i protocolli possibili portano al loro sovraccarico con i dettagli della rete a scapito della funzionalità.

Un aspetto ancora più complesso di questo problema è associato alla possibilità di utilizzare differenti rappresentazioni di dati in differenti nodi di una rete locale eterogenea. Computer diversi possono avere indirizzi, rappresentazioni numeriche, codifiche dei caratteri, ecc. Diversi. Ciò è particolarmente importante per i server di alto livello: telecomunicazioni, informatica, database.

Una soluzione comune al problema della mobilità nei sistemi basati su un'architettura client-server è affidarsi a pacchetti software che implementano protocolli RPC (Remote Procedure Call). Con questi strumenti, una chiamata a un servizio in un sito remoto sembra una normale chiamata di procedura. Gli strumenti RPC, che contengono naturalmente tutte le informazioni sulle specifiche dell'hardware di rete locale e dei protocolli di rete, traducono la chiamata in una sequenza di interazioni di rete. Pertanto, le specifiche dell'ambiente di rete e dei protocolli vengono nascoste al programmatore dell'applicazione.

Quando viene chiamata una procedura remota, i programmi RPC convertono i formati di dati del client in formati intermedi indipendenti dalla macchina e quindi convertono in formati di dati del server. Quando si passano i parametri di risposta, vengono eseguite trasformazioni simili.

Altri lavori simili che potrebbero interessarti Wshm\u003e
6914.		Concetto di database	11,56 KB
	Il database è presentato in una forma oggettiva, una serie di materiali indipendenti di articoli di calcoli di atti normativi di decisioni giudiziarie e altri materiali simili sistematizzati in modo che questi materiali possano essere trovati ed elaborati utilizzando un computer elettronico Codice civile della Federazione Russa Art. Un database organizzato secondo determinate regole e mantenuto nella memoria del computer è un insieme di dati che caratterizzano lo stato corrente di alcuni ...
8064.		Database distribuiti	43.66 KB
	Database distribuiti Un RDB di database distribuito è inteso come un insieme di dati condivisi interconnessi logicamente che sono fisicamente distribuiti su diversi nodi di una rete di computer. L'accesso ai dati non dovrebbe dipendere dalla presenza o dall'assenza di repliche di dati. Il sistema dovrebbe determinare automaticamente i metodi di esecuzione della connessione di fusione dati, il canale di rete è in grado di far fronte al volume di informazioni trasmesse e il nodo ha una potenza di elaborazione sufficiente per unirsi alle tabelle. L'RDBMS deve essere in grado di ...
20319.		DATABASE E LORO PROTEZIONE	102,86 KB
	I database online online sono emersi a metà degli anni '60. Le operazioni sui database operativi sono state elaborate in modo interattivo utilizzando terminali. Semplici organizzazioni di record con indice sequenziale si sono rapidamente evolute in un modello di record più potente e orientato al set. Charles Bachmann ha ricevuto il Premio Turing per aver guidato il Data Base Task Group (DBTG), che ha sviluppato un linguaggio standard per la descrizione e la manipolazione dei dati.
5031.		Libreria per lo sviluppo di database	11,72 MB
	Tecnologia di progettazione di database. Determinazione delle relazioni tra entità e creazione di un modello di dati. Le idee principali della moderna tecnologia dell'informazione si basano sul concetto in base al quale i dati dovrebbero essere organizzati in database al fine di riflettere adeguatamente il mondo reale in evoluzione e soddisfare le esigenze di informazione degli utenti. Questi database vengono creati e operano sotto il controllo di speciali sistemi software chiamati DBMS per sistemi di gestione di database.
13815.		MODELLO GERARCHICO DEL DATABASE	81.62 KB
	Le idee principali della moderna tecnologia dell'informazione si basano sul concetto di database, secondo il quale la base della tecnologia dell'informazione sono i dati organizzati in database che riflettono adeguatamente lo stato di una particolare area tematica e forniscono all'utente le informazioni pertinenti in questa area tematica. Bisogna riconoscere che i dati sono ...
14095.		Sviluppo di database di biblioteche	11,72 MB
	L'aumento del volume e della complessità strutturale dei dati archiviati, l'espansione della cerchia degli utenti dei sistemi informativi hanno portato ad un utilizzo diffuso dei DBMS relazionali (tabulari) più convenienti e relativamente di facile comprensione.
5061.		Creazione del database della clinica	2,4 MB
	Lo sviluppo della tecnologia informatica e della tecnologia dell'informazione ha fornito opportunità per la creazione e l'uso diffuso di sistemi informativi automatizzati (AIS) per vari scopi. Si stanno sviluppando e implementando sistemi informativi per la gestione delle strutture economiche e tecniche
13542.		Banche dati di informazioni geologiche	20,73 KB
	Recentemente, l'introduzione delle tecnologie informatiche e, in particolare, dei database, nella sfera scientifica è avvenuta rapidamente. Questo processo non aggira nemmeno la geologia, poiché è nelle scienze naturali che è necessario memorizzare ed elaborare grandi quantità di informazioni.
9100.		Banca dati. Concetti basilari	26.28 KB
	Un database è una raccolta di informazioni su oggetti specifici del mondo reale in qualsiasi area tematica di economia, gestione, chimica, ecc. Lo scopo di un sistema informativo non è solo quello di memorizzare dati sugli oggetti, ma anche di manipolare questi dati, tenendo conto delle connessioni tra gli oggetti. Ogni oggetto è caratterizzato da un insieme di dati di proprietà, chiamati attributi nel database.
5240.		Creazione del database "Dean's office"	1,57 MB
	Il database (DB) è un insieme di dati interconnessi memorizzati insieme su un supporto di archiviazione esterno di un computer, con una tale organizzazione e una ridondanza minima che consente di utilizzarli in modo ottimale per una o più applicazioni

Sempre più spesso, i professionisti IT rivolgono la loro attenzione a soluzioni di gestione dei dati basate su modelli di dati standard del settore e modelli di decisioni aziendali. Modelli di dati fisici complessi pronti per il download e report di business intelligence per aree di attività specifiche consentono di unificare la componente informativa dell'azienda e di accelerare notevolmente l'esecuzione dei processi aziendali. I modelli di soluzione consentono ai fornitori di servizi di sfruttare il potere delle informazioni non standard nascoste nei sistemi esistenti, riducendo così i tempi, i costi ei rischi del progetto. Ad esempio, i progetti del mondo reale mostrano che il modello di dati e i modelli di decisione aziendale possono ridurre lo sforzo di sviluppo del 50%.

Un modello logico di settore è una vista specifica del dominio, integrata e strutturata in modo logico di tutte le informazioni che devono risiedere in un data warehouse aziendale per rispondere a domande aziendali strategiche e tattiche. Lo scopo principale dei modelli è facilitare l'orientamento nello spazio dati e aiutare a evidenziare i dettagli che sono importanti per lo sviluppo del business. In condizioni moderne, per un business di successo, è assolutamente necessario avere una chiara comprensione delle connessioni tra le varie componenti e avere una buona idea del quadro generale dell'organizzazione. L'individuazione di tutti i dettagli e le relazioni mediante modelli consente il più efficiente utilizzo dei tempi e degli strumenti di organizzazione del lavoro aziendale.

I modelli di dati sono modelli astratti che descrivono il modo in cui i dati vengono presentati e accessibili. I modelli di dati definiscono gli elementi di dati e le relazioni tra di essi in una particolare area. Un modello di dati è uno strumento di navigazione sia per i professionisti aziendali che per i professionisti IT che utilizza una serie specifica di simboli e parole per spiegare con precisione una classe specifica di informazioni del mondo reale. Ciò consente una migliore comunicazione all'interno dell'organizzazione e quindi crea un ambiente applicativo più flessibile e stabile.

Un esempio di un modello GIS per governo e governo locale.

Oggi è strategicamente importante per i fornitori di software e servizi essere in grado di rispondere rapidamente ai cambiamenti nel settore associati alle innovazioni tecnologiche, alla rimozione delle restrizioni governative e alla complessità delle catene di approvvigionamento. Insieme ai cambiamenti nel modello di business, aumenta la complessità e il costo della tecnologia informatica necessaria per supportare le operazioni di un'azienda. La gestione dei dati è particolarmente difficile in un ambiente in cui i sistemi informativi aziendali e le loro esigenze funzionali e aziendali sono in continua evoluzione.

I modelli di dati di settore sono progettati per facilitare e snellire questo processo e spostare l'approccio IT a un livello moderno.

Modelli di dati di settore dell'aziendaEsri

I modelli di dati Esri ArcGIS sono modelli funzionanti da utilizzare nei progetti GIS e per la creazione di strutture di dati per varie aree applicative. La creazione del modello di dati implica la creazione di un design concettuale, una struttura logica e fisica che può essere utilizzata per costruire un geodatabase personale o aziendale. ArcGIS fornisce strumenti per creare e gestire lo schema del database e i modelli di modello di dati vengono utilizzati per avviare rapidamente un progetto GIS in una varietà di applicazioni e settori. Esri ha trascorso una notevole quantità di tempo con la comunità degli utenti per sviluppare una gamma di modelli che possono fornire un rapido avvio alla progettazione di un geodatabase aziendale. Questi progetti sono descritti e documentati su support.esri.com/datamodels. Di seguito, nell'ordine in cui appaiono su questo sito, c'è una traduzione semantica dei nomi dei modelli di settore di Esri:

Registro degli indirizzi
agricoltura
Meteorologia
Dati spaziali di base
Biodiversità
Spazio interno degli edifici
Contabilità dei gas serra
Mantenimento dei confini amministrativi
Stabilimento militare. Servizio di intelligence
Energy (incluso il nuovo protocollo ArcGIS MultiSpeak)
Strutture ecologiche
Ministero delle situazioni di emergenza. Vigili del fuoco
Catasto forestale
Silvicoltura
Geologia
GIS nazionale (e-gov)
Acque sotterranee e acque reflue
Assistenza sanitaria
Archeologia e conservazione dei luoghi della memoria
sicurezza nazionale
Idrologia
Organizzazione idrografica internazionale (IHO). Formato S-57 per ENC
Irrigazione
Catasto
Governo municipale
Navigazione nautica
Catasto dello Stato
Strutture petrolifere e del gas
Condutture
Archiviazione raster
Batimetria, rilievo del fondale marino
Telecomunicazioni
Trasporto
Approvvigionamento idrico, fognatura, alloggio e servizi comunali

Questi modelli contengono tutte le caratteristiche necessarie dello standard del settore, ovvero:

sono disponibili gratuitamente;
non sono legati alla tecnologia del produttore “scelto”;
creato come risultato della realizzazione di progetti reali;
realizzato con la partecipazione di esperti del settore;
sono progettati per fornire l'interazione delle informazioni tra vari prodotti e tecnologie;
non contraddire altri standard e regolamenti;
utilizzato in progetti completati in tutto il mondo;
sono progettati per funzionare con le informazioni durante l'intero ciclo di vita del sistema in fase di creazione e non con il progetto stesso;
espandibile secondo le esigenze del cliente senza perdere la compatibilità con altri progetti e / o modelli;
accompagnato da materiali ed esempi aggiuntivi;
utilizzato nelle linee guida e nei materiali tecnici di varie società industriali;
una grande comunità di partecipanti, mentre l'accesso alla comunità è aperto a tutti;
un gran numero di riferimenti a modelli di dati nelle pubblicazioni degli ultimi anni.

Esri fa parte di un gruppo di esperti di organismi indipendenti che raccomandano vari modelli di settore, come PODS (Pipeline Open Data Standards - uno standard aperto per l'industria petrolifera e del gas; PODS è attualmente implementato come geodatabase Esri PODS Esri Spatial 5.1.1) o un geodatabase (geodatabase) di ArcGIS for Aviation, che tiene conto delle raccomandazioni ICAO e FAA, nonché dello standard di scambio dei dati di navigazione AIXM 5.0. Inoltre, ci sono modelli consigliati che aderiscono rigorosamente agli standard di settore esistenti, come S-57 e ArcGIS for Maritime (caratteristiche marine e costiere), nonché modelli creati dal lavoro svolto da Esri Professional Services e sono de facto standard nei corrispondenti la zona. Ad esempio, GIS per la nazione e il governo locale hanno influenzato gli standard NSDI e INSPIRE e Hydro e Groundwater (idrologia e acque sotterranee) sono ampiamente utilizzati nella suite professionale ArcHydro e nei prodotti commerciali disponibili gratuitamente. terzi. Va notato che Esri supporta anche standard de facto come NHDI. Tutti i modelli di dati proposti sono documentati e pronti per l'uso nei processi IT aziendali. I materiali di accompagnamento per i modelli includono:

Diagrammi UML delle relazioni tra entità;
strutture dati, domini, directory;
modelli di geodatabase già pronti in formato ArcGIS GDB;
dati campione e applicazioni campione;
esempi di script di caricamento dati, esempi di utilità di analisi;
libri di riferimento sulla struttura dati proposta.

Esri riassume la sua esperienza nella creazione di modelli di settore in libri e localizza il materiale pubblicato. I seguenti libri sono stati localizzati e pubblicati da Esri CIS:

Architettura orientata ai servizi geospaziali (SOA);
Progettazione di database geografici per il trasporto;
Sistemi informativi geografici aziendali;
GIS: nuova energia per le imprese elettriche e del gas;
Petrolio e gas su una mappa digitale;
Modellare il nostro mondo. Esri Geodatabase Design Guide;
Pensando al GIS. Pianificazione GIS: una guida per i manager;
Sistemi di informazione geografica. Nozioni di base;
GIS per la gestione amministrativa ed economica;
Web GIS. Principi e applicazioni;
Systems Design Strategies, 26a edizione;
68 numeri della rivista ArcReview con pubblicazioni di aziende e utenti di sistemi GIS;
... e molte altre note e pubblicazioni tematiche.

Ad esempio, il libro " Modellare il nostro mondo ..."(traduzione) è una guida completa e un riferimento per la modellazione dei dati GIS in generale, e il modello dei dati geodatabase in particolare. Il libro mostra come elaborare le giuste decisioni sulla modellazione dei dati, decisioni che sono coinvolte in ogni aspetto di un progetto GIS, dalla progettazione del database alla raccolta di dati e dati per l'analisi e la visualizzazione spaziale Descrive in dettaglio come progettare un database geografico appropriato per un progetto, configurare la funzionalità del database senza programmazione, gestire il flusso di lavoro in progetti complessi, modellare varie strutture di rete come reti fluviali, di trasporto o elettriche, integrare le immagini satellitari nel processo di analisi e visualizzazione geografica e creare modelli 3D di dati GIS. Prenota " Progettazione di database geografici per il trasporto"contiene approcci metodologici che sono stati testati su un gran numero di progetti e rispettano pienamente i requisiti legislativi di Europa e Stati Uniti, nonché gli standard internazionali. E nel libro" GIS: nuova energia per impianti elettrici e gas"Utilizzando esempi del mondo reale, mostra i vantaggi che il GIS aziendale può portare al fornitore di energia, inclusi aspetti come il servizio clienti, le operazioni di rete e altri processi aziendali.

Alcuni dei libri, tradotti e originali, pubblicati in russo da Esri CIS e DATA +. Affrontano sia le questioni concettuali relative alla tecnologia GIS, sia molti aspetti applicati della modellazione e della distribuzione di GIS di varie scale e scopi.

Considereremo l'applicazione dei modelli di settore utilizzando l'esempio del BISDM (Building Interior Space Data Model, modello informativo dello spazio interno di un edificio) versione 3.0. BISDM è uno sviluppo di un modello BIM (Building Information Model) più generale ed è destinato all'uso nella progettazione, costruzione, funzionamento e smantellamento di edifici e strutture. Utilizzato nel software GIS, consente di scambiare in modo efficiente geodati con altre piattaforme e interagire con esse. Si riferisce al gruppo generale di attività FM (gestione dell'infrastruttura dell'organizzazione). Elenchiamo i principali vantaggi del modello BISDM, il cui utilizzo consente:

organizzare lo scambio di informazioni in un ambiente eterogeneo secondo regole uniformi;
ottenere un'incarnazione "fisica" del concetto BIM e delle regole raccomandate per la gestione del progetto di costruzione;
mantenere un unico impianto di stoccaggio tramite GIS durante l'intero ciclo di vita di un edificio (dalla progettazione allo smantellamento);
coordinare il lavoro di vari specialisti nel progetto;
visualizzare il programma pianificato e le fasi di costruzione per tutti i partecipanti;
fornire una stima preliminare del costo e dei tempi di costruzione (dati 4D e 5D);
monitorare lo stato di avanzamento del progetto;
garantire un funzionamento di alta qualità dell'edificio, compresa la manutenzione e le riparazioni;
entrare a far parte del sistema di gestione del risparmio, comprese le funzioni di analisi dell'efficacia dell'utilizzo degli spazi (locazione, magazzino, gestione del personale);
calcolare e gestire gli obiettivi di efficienza energetica dell'edificio;
simulare il movimento dei flussi umani.

BISDM definisce le regole per lavorare con i dati spaziali a livello dei locali interni di un edificio, inclusi lo scopo e gli usi, le comunicazioni previste, le apparecchiature installate, la contabilizzazione delle riparazioni e della manutenzione, la registrazione degli incidenti e l'interconnessione con altre risorse aziendali. Il modello aiuta a creare un repository unificato di dati geografici e non geografici. L'esperienza delle aziende leader mondiali è stata utilizzata per isolare entità e modellare a livello di geodatabase (geodatabase) delle relazioni spaziali e logiche di tutti gli elementi fisici che formano sia l'edificio stesso che i suoi locali interni. Seguire i principi del BISDM può semplificare notevolmente i compiti di integrazione con altri sistemi. La prima fase è solitamente l'integrazione CAD. Quindi, durante il funzionamento dell'edificio, viene utilizzato lo scambio di dati con i sistemi ERP ed EAM (SAP, TRIRIGA, Maximo, ecc.).

Visualizzazione di elementi strutturali BISDM utilizzando ArcGIS.

Nel caso di utilizzo di BISDM, il cliente / proprietario della struttura riceve uno scambio di informazioni end-to-end dall'idea di creare un oggetto allo sviluppo di un progetto completo, controllo della costruzione con l'ottenimento di informazioni pertinenti al momento della messa in funzione dell'impianto, controllo dei parametri durante il funzionamento e persino durante la ricostruzione o lo smantellamento dell'impianto. Seguendo il paradigma BISDM, GIS e il geo-database creato con il suo aiuto diventano un archivio di dati comune per i sistemi correlati. Spesso, i dati creati e gestiti da sistemi di terze parti vengono visualizzati nel GDB. Questo deve essere preso in considerazione quando si progetta l'architettura del sistema che si sta creando.

A un certo punto, la "massa critica" di informazioni accumulate consente di passare a un nuovo livello qualitativo. Ad esempio, al termine della fase di progettazione di un nuovo edificio, è possibile visualizzare automaticamente i modelli di rilievo 3D in GIS, compilare un elenco delle apparecchiature installate, calcolare il chilometraggio delle utenze da posare, eseguire una serie di controlli e persino fornire una stima finanziaria preliminare del costo del progetto.

Ancora una volta, notiamo che quando BISDM e ArcGIS vengono utilizzati insieme, diventa possibile costruire automaticamente modelli 3D dai dati accumulati, poiché il geodatabase contiene una descrizione completa dell'oggetto, comprese le coordinate z, l'appartenenza al pavimento, i tipi di connessioni degli elementi, i metodi di installazione dell'apparecchiatura, il materiale, i percorsi disponibili movimenti del personale, scopo funzionale di ogni elemento, ecc. eccetera. Va notato che dopo l'importazione iniziale di tutti i materiali di progettazione nel BISDM GDB, è necessario un contenuto informativo aggiuntivo per:

posizionamento di modelli 3D di oggetti e attrezzature in luoghi designati;
raccogliere informazioni sul costo dei materiali e sulla procedura per la loro posa e installazione;
controllo di fondo in base alle dimensioni dell'attrezzatura non standard installata.

Grazie all'uso di ArcGIS, è più semplice importare ulteriori oggetti 3D e riferimenti da fonti esterne, perché ArcGIS Data Interoperability consente di creare procedure per importare tali dati e posizionarli correttamente all'interno del modello. Sono supportati tutti i formati utilizzati nel settore, inclusi IFC, AutoCAD Revit, Bentlye Microstation.

Modelli di dati di settore di IBM

IBM fornisce una serie di strumenti e modelli di gestione dello storage per una varietà di aree di business:

IBM Banking and Financial Markets Data Warehouse (finanza)
IBM Banking Data Warehouse
Processo bancario IBM e modelli di servizio
IBM Health Plan Data Model (sanità)
IBM Insurance Information Warehouse (assicurazione)
Processo assicurativo IBM e modelli di servizio
IBM Retail Data Warehouse (vendita al dettaglio)
IBM Telecommunications Data Warehouse (telecomunicazioni)
Pacchetto InfoSphere Warehouse:
- per Customer Insight (per comprendere i clienti)
- per Market and Campaign Insight (per comprendere l'azienda e il mercato)
- per Supply Chain Insight (per comprendere i fornitori).

Ad esempio, il modello IBMBancarioeFinanziarioMercatiDatiMagazzino è progettato per affrontare i problemi specifici del settore bancario in termini di dati, e IBMBancarioProcessieServizioModelli - in termini di processi e SOA (Service Oriented Architecture). Per il settore delle telecomunicazioni, vengono presentati i modelli IBMInformazioneStruttura (IFW) e IBMTelecomunicazioniDatiMagazzino (TDW)... Aiutano ad accelerare in modo significativo il processo di creazione di sistemi analitici, oltre a ridurre i rischi associati allo sviluppo di applicazioni di business intelligence, alla gestione dei dati aziendali e all'organizzazione dei data warehouse, tenendo conto delle specificità del settore delle telecomunicazioni. Le capacità di IBM TDW coprono l'intero spettro del mercato delle telecomunicazioni - dai fornitori di Internet e operatori di reti via cavo che offrono servizi di telefonia cablata e wireless, trasmissione di dati e contenuti multimediali, alle società multinazionali che forniscono servizi di comunicazione telefonica, satellitare, a lunga distanza e internazionale, nonché alle organizzazioni reti globali. Oggi TDW è utilizzato da grandi e piccoli fornitori di servizi cablati e wireless in tutto il mondo.

Uno strumento chiamato InfoSphere Warehouse Pack per Customer Insight fornisce contenuti aziendali strutturati e facili da implementare per un numero crescente di progetti e settori aziendali, tra cui banche, assicurazioni, finanza, programmi di assicurazione sanitaria, telecomunicazioni, vendita al dettaglio e distribuzione. Per utenti aziendali InfoSphere Warehouse Pack per informazioni sul mercato e sulla campagna aiuta a massimizzare l'efficienza delle analisi di mercato e delle campagne di marketing attraverso un processo graduale di sviluppo e tenendo conto delle specificità del business. Attraverso Pacchetto InfoSphere Warehouse per Supply Chain Insight le organizzazioni hanno la capacità di ricevere informazioni aggiornate sulle operazioni della catena di fornitura.

La posizione di Esri all'interno dell'architettura della soluzione IBM.

Particolarmente degno di nota è l'approccio IBM a utilità e utilità. Per soddisfare le crescenti richieste dei consumatori, le utility necessitano di un'architettura più flessibile di quelle in uso oggi, nonché di un modello a oggetti standard del settore per facilitare il libero flusso di informazioni. Ciò migliorerà le capacità di comunicazione delle utilità, consentendo la comunicazione in un modo più economico e fornirà ai nuovi sistemi una migliore visibilità di tutte le risorse richieste, indipendentemente da dove si trovano all'interno dell'organizzazione. La base di questo approccio è SOA (Service Oriented Architecture), un modello di componenti che mappa le funzioni della business unit a servizi applicativi riutilizzabili. I "servizi" di tali componenti scambiano dati attraverso interfacce senza vincoli rigidi, nascondendo all'utente tutta la complessità dei sistemi che stanno dietro. In questa modalità, le aziende possono aggiungere facilmente nuove applicazioni indipendentemente dal fornitore del software, dal sistema operativo, dal linguaggio di programmazione o da altre caratteristiche del software interno. Basato su SOA, il concetto è implementato SICURO (Solution Architecture for Energy), consente alla società di servizi di ottenere una visione olistica e basata su standard della propria infrastruttura.

Esri ArcGIS® è una piattaforma software riconosciuta a livello internazionale per i sistemi di informazione geografica (GIS), che fornisce la creazione e la gestione di risorse digitali di energia elettrica, trasmissione del gas, distribuzione e reti di telecomunicazione. ArcGIS consente di effettuare l'inventario più completo dei componenti della rete di distribuzione elettrica, tenendo conto della loro ubicazione spaziale. ArcGIS estende notevolmente l'architettura IBM SAFE fornendo gli strumenti, le applicazioni, i flussi di lavoro, le funzionalità di analisi e integrazione delle informazioni necessarie per gestire una società energetica intelligente. ArcGIS nell'ambito di IBM SAFE consente di ricevere informazioni da varie fonti su strutture dell'infrastruttura, risorse, clienti e dipendenti con dati accurati sulla loro posizione, nonché creare, archiviare ed elaborare informazioni georeferenziate sulle risorse aziendali (supporti, condutture, fili, trasformatori, canaline per cavi eccetera.). ArcGIS all'interno dell'infrastruttura SAFE collega dinamicamente le applicazioni aziendali principali combinando i dati provenienti da GIS, SCADA e sistemi di assistenza clienti con informazioni esterne come l'intensità del traffico, le condizioni meteorologiche o le immagini satellitari. Le utility utilizzano queste informazioni combinate per una varietà di scopi, da S.O.R. (il quadro generale dell'ambiente operativo) all'ispezione del sito, alla manutenzione, all'analisi e alla pianificazione della rete.

I componenti informativi di una società di servizi possono essere modellati utilizzando diversi livelli che vanno dal livello più basso - fisico - al livello più alto e più complesso di logica aziendale. Questi livelli possono essere integrati per soddisfare i requisiti tipici del settore, come la registrazione automatizzata delle misurazioni e la gestione SCADA. Costruendo l'architettura SAFE, le utility stanno facendo passi da gigante nella promozione di un modello a oggetti aperto a livello di settore chiamato Common Information Model (CIM) per energia e servizi di pubblica utilità. Questo modello fornisce le basi necessarie per spostare molte aziende verso un'architettura orientata ai servizi in quanto incoraggia l'uso di standard aperti per la strutturazione di dati e oggetti. A causa del fatto che tutti i sistemi utilizzano gli stessi oggetti, la confusione e l'inelasticità associate a diverse implementazioni degli stessi oggetti saranno ridotte al minimo. Pertanto, la definizione dell'oggetto client e di altri importanti oggetti di business saranno unificati in tutti i sistemi dell'utilità. Ora, con CIM, i fornitori di servizi e i consumatori di servizi possono condividere una struttura di dati comune, rendendo più facile esternalizzare componenti aziendali costosi poiché CIM stabilisce una base comune su cui costruire lo scambio di informazioni.

Conclusione

I modelli di dati di settore completi forniscono alle aziende una visione unica e integrata delle informazioni aziendali. Molte aziende hanno difficoltà a integrare i propri dati, sebbene questo sia un prerequisito per la maggior parte dei progetti a livello aziendale. Secondo uno studio del Data Warehousing Institute (TDWI), oltre il 69% delle organizzazioni intervistate ha rilevato che l'integrazione rappresenta un ostacolo significativo all'adozione di nuove applicazioni. Al contrario, l'implementazione dell'integrazione dei dati porta all'azienda un reddito tangibile e una maggiore efficienza.

Un modello costruito correttamente identifica in modo univoco il significato dei dati, che in questo caso sono dati strutturati (al contrario di dati non strutturati come un'immagine, un file binario o un testo, dove il significato può essere ambiguo). I modelli di settore più efficaci sono quelli offerti da fornitori professionali come Esri e IBM. L'elevato ritorno sull'utilizzo dei loro modelli è ottenuto grazie al livello significativo di dettaglio e precisione. Di solito contengono molti attributi di dati. Inoltre, sia Esri che IBM hanno una vasta esperienza di modellazione e sono esperti nella creazione di modelli specifici del settore.

Per vendere, devi capire cosa stiamo vendendo

Definiamo la terminologia e i concetti. ( Data Warehouse) Non è un sistema di indicatori chiave di prestazione (KPI, KPI), non è un grande database, non è un database analitico Strumento OLAP, questo non è un sistema intelligente che consente di estrarre nuovi dati e ottenere dipendenze statistiche, questo non è un sistema di dati di riferimento singoli - tutto questo non è un CD, se ne parliamo nel contesto di un singolo elemento.

Data warehouse aziendale – è una matrice appositamente organizzata di dati aziendali (organizzazione), elaborati e archiviati in un unico complesso hardware e software, che fornisce un rapido accesso a informazioni operative e storiche, analisi di dati multidimensionali (KPI per varie dimensioni), ottenendo previsioni e statistiche in termini di normative e informazioni di riferimento (NSI).

Potenziali clienti per il data warehouse aziendale e cosa ottengono?

Come identificare i potenziali clienti aziendali che cercano un data warehouse?

Prima di tutto, molte informazioni dovrebbero sorgere nelle attività quotidiane dell'azienda. Possono essere telefonate, transazioni finanziarie, reclami / recensioni dei clienti, richieste di spedizione dei clienti, informazioni dai satelliti spia, ecc. In linea di principio, qualsiasi cosa, la cosa principale è che ci sono molti dati.
Il potenziale cliente dovrebbe avere il desiderio di vedere e analizzare queste informazioni. In questo caso, il periodo di analisi dovrebbe essere piuttosto ampio: da un giorno o anche un'ora a un'analisi di diversi anni.
Il client deve disporre di un'infrastruttura normalmente funzionante (non dovrebbero esserci server collegati tramite un cavo a doppino intrecciato o tramite una porta USB). Se il cliente non dispone dell'infrastruttura, deve venderla.

Quali vantaggi ottiene un cliente dall'implementazione di un data warehouse aziendale?

Viene visualizzato un sistema informativo unificato per l'archiviazione dei dati aziendali, in cui viene utilizzata un'informazione di riferimento unificata.
Diventa possibile condurre un'analisi completa del business. Ad esempio: quali sono i clienti più redditizi e redditizi; quale servizio è più richiesto con quali clienti, che tipo di reclami sono più frequenti e in quali regioni, ecc.
Diventa possibile effettuare analisi utilizzando dati storici. Spesso i sistemi operativi (automatizzando i processi aziendali quotidiani) non lo consentono, semplicemente non hanno spazio sufficiente per archiviare la cronologia e la capacità di analisi.
Diventa possibile connettere e analizzare informazioni precedentemente memorizzate in diversi sistemi informativi. Ad esempio, i dati sul traffico per diversi rami vengono memorizzati nei sistemi di fatturazione di diversi sviluppatori. Dopo l'implementazione del CD, diventa possibile analizzarli insieme, in un unico report.
Diventa possibile analizzare e incrociare dati di diverso tipo. Ad esempio, denaro e traffico, numero di dipendenti e numero di rifiuti o reclami, ecc.
Appare una base per un migliore calcolo del costo dei servizi: sulla base delle informazioni provenienti dal data warehouse aziendale è possibile ottenere dati più adeguati per basi distributive naturali.

Cos'è un data warehouse aziendale

Da un punto di vista tecnico, quali componenti utilizza un data warehouse aziendale?

Componenti data warehouse aziendale imprese

Il cliente ha sempre sistemi operativi - origine dei dati per il data warehouse aziendale. Questi sono, ad esempio, contabilità, fatturazione, servizi bancari, ecc. sistemi.
Utilizzando Applicazione ETL (software che consente di estrarre, trasformare e caricare i dati), i dati dai sistemi di origine vengono inseriti nel database del data warehouse. I seguenti strumenti possono essere utilizzati come strumenti ETL: Informatica Power Center, IBM DataStage, Oracle Data Integrator, Oracle WareHouse Builder. Ci sono anche prodotti di altri fornitori, ma quasi non sono rappresentati sul mercato russo.
Si banca dati lo storage aziendale non è astratto nella sua struttura (un insieme di tabelle, campi in esse e relazioni tra tabelle), ma è creato sulla base di modelli di dati. La stragrande maggioranza utilizza Oracle o Teradata come database.
Modello di dati è una descrizione di tutte le entità, oggetti di database del data warehouse aziendale e include: modello dati concettuale, modello dati logico e fisico modello di database ... A livello del modello concettuale, vengono determinate le entità e le relazioni tra loro. A livello di modello logico, le entità sono suddivise in aree di business, viene fornita una descrizione dettagliata e completa e vengono scritte le relazioni. Quando si sviluppa un modello di database fisico, viene determinata l'intera struttura del database, dalle tabelle e dai campi in essi contenuti, alle partizioni e agli indici. Modelli di dati Oggi IBM, SAP e Oracle riforniscono il mercato, ma acquistare un modello di dati non significa automaticamente costruire il giusto magazzino aziendale. Modello di dati non è un prodotto in scatola. Deve essere modificato per le esigenze di un particolare cliente.
Inoltre, già utilizzando i dati del data warehouse aziendale, le aree di analisi, reporting e data mart... Successivamente, gli utenti possono costruire in autonomia la reportistica necessaria ed eseguire analisi multidimensionali. Business Objects, Oracle Discoverer, IBM AlphaBlocks e altri prodotti vengono utilizzati principalmente come strumenti di analisi.

Aspetto dei componenti di un data warehouse aziendale (modello di dati, processi ETL, data mart)

Forniremo esempi illustrativi di un modello di dati, implementazione del processo ETL, forme di supporto per un singolo dato di riferimento, data mart.

Modello logico dati.
Definisce le entità, i loro attributi e le relazioni tra di loro.

Processo ETL eliminando i duplicati nei dati di origine

Modulo di inserimento dati per la formazione di una rubrica unificata

Vetrina dati sotto forma di report tabellare

Vetrina dati con grafica e colore
output di dati in una determinata condizione

Vetrina dati con programma

Software e hardware correlati

Innanzitutto, oltre ai servizi per lo sviluppo di un data warehouse aziendale, vengono vendute anche licenze sia per software server (OS, database, application server, ecc.) Che per siti client (protezione antivirus e sicurezza).

I server esistenti del client potrebbero non essere progettati per la distribuzione del datastore. È necessario presentare i requisiti per loro e vendere l'hardware a un potenziale cliente.

Oltre ai server stessi, gli array di dischi sono necessari per memorizzare una notevole quantità di informazioni.

Intendendo costruire un data warehouse aziendale, un potenziale cliente non sempre capisce come fornirà il backup. Spesso, i sistemi di backup esistenti del client non sono in grado di connettere simultaneamente volumi di dati da 20-30 TB al backup.

In genere, gli specialisti e gli utenti del cliente richiedono corsi di formazione.

Kovtun M.V. Agosto 2010

Inviare il tuo buon lavoro nella knowledge base è semplice. Utilizza il modulo sottostante

Studenti, dottorandi, giovani scienziati che utilizzano la base di conoscenza nei loro studi e nel loro lavoro te ne saranno molto grati.

postato su http://www.allbest.ru/

1. Modello dati relazionale

1.1 Il modello dei dati relazionali. Definizioni di base
1.2 Operazioni sui rapporti

2. Sistemi informativi aziendali
Bibliografia

1. Modello dati relazionale

1.1 Il modello dei dati relazionali. Definizioni di base

Nelle discipline matematiche, il concetto di "tabella" corrisponde al concetto di "relazione" (relazione). La tabella riflette un oggetto del mondo reale, un'entità, e ciascuna delle sue linee riflette un'istanza specifica dell'entità. Ogni colonna ha un nome univoco per la tabella. Le stringhe non hanno nomi, il loro ordine non è definito e il numero è logicamente illimitato. Uno dei principali vantaggi di un modello di dati relazionali è l'omogeneità (ogni riga di una tabella ha lo stesso formato). Spetta all'utente decidere se le rispettive entità sono omogenee. Questo risolve il problema dell'idoneità del modello.

Concetti basilari:

* Un rapporto è una tabella bidimensionale contenente alcuni dati.

* Entità - un oggetto di qualsiasi natura, i cui dati sono memorizzati nel database. Gli attributi sono proprietà che caratterizzano un'entità (colonne).

* Il grado di relazione è il numero di colonne.

* Schema di relazione: un elenco di nomi di attributi, ad esempio DIPENDENTE (n., Nome completo, anno di nascita, posizione, dipartimento).

* Dominio - un insieme di valori degli attributi di una relazione (tipo di dati).

* Una tupla è una riga di tabella.

* Cardinalità (cardinalità): il numero di righe nella tabella.

* La chiave primaria è un attributo che identifica in modo univoco le righe di una relazione. Una chiave primaria multi-attributo è chiamata composita. La chiave primaria non può essere completamente o parzialmente vuota (null). Le chiavi che possono essere utilizzate come chiavi primarie sono chiamate chiavi potenziali o alternative.

* Una chiave esterna è un attributo / i di una tabella che può fungere da chiave primaria di un'altra tabella. Fa riferimento alla chiave primaria di un'altra tabella.

La normalizzazione è un processo volto a ridurre la ridondanza delle informazioni in un database. Oltre ai dati stessi, nel database possono essere normalizzati anche vari nomi, nomi di oggetti ed espressioni.

Un database non normalizzato contiene informazioni in una o più tabelle diverse; questo dà l'impressione che l'inclusione dei dati in una particolare tabella non sia dovuta a ragioni apparenti. Questo stato di cose può avere un impatto negativo sulla sicurezza dei dati, sull'uso razionale dello spazio su disco, sulla velocità delle query, sull'efficienza dell'aggiornamento del database e, cosa forse più importante, sull'integrità delle informazioni memorizzate. Il database prima della normalizzazione è una struttura che non è stata scomposta logicamente in tabelle più piccole e più gestibili.

La forma normale è una sorta di indicatore del livello, o profondità, della normalizzazione del database. Il livello di normalizzazione del database corrisponde alla forma normale in cui si trova.

1.2 Operazioni sui rapporti

Per portare la tabella alla prima forma normale (1NF), è necessario osservare due regole:

1. Atomicità o indivisibilità. Ogni colonna deve contenere un valore indivisibile.

2. La tabella non deve contenere colonne o gruppi di dati duplicati.

Ad esempio, se una tabella contiene in un campo l'indirizzo completo di una persona (via, città, codice postale), non soddisferà le regole 1NF, poiché conterrà valori diversi in una colonna, il che sarebbe una violazione della regola di atomicità. Oppure, se il database contiene dati sui film e contiene le colonne attore1, attore2, attore3, non sarà nemmeno conforme alle regole, poiché i dati verranno ripetuti.

La normalizzazione dovrebbe iniziare verificando la compatibilità della struttura del database con 1NF. Tutte le colonne che non sono atomiche devono essere suddivise nelle colonne che lo costituiscono. Se nella tabella sono presenti colonne duplicate, è necessario selezionare una tabella separata.

Per riportare la tabella alla prima forma normale, dovresti:

* Trova tutti i campi che contengono più parti di informazioni.

* I dati che possono essere suddivisi in parti componenti devono essere inseriti in campi separati.

* Spostare i dati duplicati in una tabella separata.

* Controlla se tutte le tabelle corrispondono alle condizioni della prima forma normale.

Per portare le tabelle alla seconda forma normale (2NF), le tabelle dovrebbero essere già in 1NF. La normalizzazione dovrebbe procedere in ordine.

Ora, nella seconda forma normale, la condizione deve essere soddisfatta: qualsiasi colonna che non sia una chiave (inclusa quella esterna) deve dipendere dalla chiave primaria. In genere, queste colonne con valori indipendenti dalla chiave sono facili da identificare. Se i dati contenuti nella colonna non sono correlati alla chiave che descrive la riga, devono essere separati in una tabella separata. La chiave primaria deve essere restituita alla vecchia tabella.

Per portare la base alla seconda forma normale, è necessario:

* Identifica tutte le colonne che non dipendono direttamente dalla chiave primaria di questa tabella.

* Crea i campi obbligatori nelle tabelle utenti e forum, seleziona da campi esistenti o crea chiavi primarie da nuove.

* Ogni tabella necessita della propria chiave primaria

* Creare chiavi esterne e designare le loro relazioni tra le tabelle. Il passaggio finale della normalizzazione a 2NF sarà l'assegnazione di chiavi esterne per la comunicazione con le tabelle associate. La chiave primaria di una tabella deve essere una chiave esterna in un'altra.

Suggerimenti:

Un altro modo per convertire uno schema in 2NF è guardare le relazioni tra le tabelle. Idealmente, crea tutte le relazioni uno-a-molti. Le relazioni molti a molti devono essere ristrutturate.

Una tabella correttamente normalizzata non avrà mai righe duplicate (due o più righe i cui valori non sono chiavi e contengono gli stessi dati).

Il database sarà nella terza forma normale se viene convertito nella seconda forma normale e ogni colonna non chiave è indipendente l'una dall'altra. Se il processo di normalizzazione è stato seguito correttamente fino a questo punto, potrebbero non esserci domande sulla conversione a 3NF. È necessario essere consapevoli del fatto che 3NF viene violato se la modifica del valore in una colonna richiede una modifica nell'altra colonna.

Per portare la base alla terza forma normale, è necessario:

* Determina quali campi di quali tabelle hanno interdipendenze, ad es. campi che dipendono più l'uno dall'altro che dalla riga nel suo insieme.

* Crea tabelle di corrispondenza. Se nel passaggio 1 è presente una colonna problematica, creare tabelle divise per essa.

* Crea o assegna chiavi primarie. Ogni tabella deve avere una chiave primaria.

* Creare le chiavi esterne richieste che formano una qualsiasi delle relazioni.

Nella quarta forma normale, una regola aggiuntiva consiste nell'escludere le dipendenze multivalore. In altre parole, tutte le righe di una tabella devono essere indipendenti l'una dall'altra. La presenza di una riga X non dovrebbe significare che anche la riga Y è da qualche parte in questa tabella.

2. Sistemi informativi aziendali

sistema dati modello relazionale

Un sistema (dal greco systema - un intero composto composto da parti) è un insieme di elementi che interagiscono tra loro, formando una certa integrità, unità. Ecco alcuni concetti che vengono spesso utilizzati per caratterizzare un sistema.

1. Elemento di sistema - una parte del sistema che ha uno scopo funzionale specifico. Gli elementi complessi dei sistemi, a loro volta, costituiti da elementi interconnessi più semplici, sono spesso chiamati sottosistemi.

2. Organizzazione del sistema: ordine interno, coerenza dell'interazione degli elementi del sistema, manifestata, in particolare, nel limitare la varietà degli stati degli elementi all'interno del sistema.

3. La struttura del sistema - la composizione, l'ordine e i principi di interazione degli elementi del sistema, che determinano le proprietà di base del sistema. Se i singoli elementi del sistema sono distanziati su diversi livelli e le connessioni interne tra gli elementi sono organizzate solo da livelli superiori a livelli inferiori e viceversa, allora si parla della struttura gerarchica del sistema. Le strutture puramente gerarchiche sono praticamente rare, quindi, ampliando in qualche modo questo concetto, la struttura gerarchica viene solitamente intesa come tali strutture, dove, tra le altre connessioni, le relazioni gerarchiche sono di fondamentale importanza.

4. Architettura di sistema: un insieme di proprietà di sistema essenziali per l'utente.

5. Integrità del sistema - l'irriducibilità fondamentale delle proprietà del sistema alla somma delle proprietà dei suoi singoli elementi (comparsa delle proprietà) e, allo stesso tempo, la dipendenza delle proprietà di ogni elemento dalla sua posizione e funzione all'interno del sistema.

Il sistema informativo è un insieme interconnesso di strumenti, metodi e personale utilizzati per archiviare, elaborare ed emettere informazioni al fine di raggiungere l'obiettivo prefissato "

La legge federale "sull'informazione, l'informatizzazione e la protezione delle informazioni" fornisce la seguente definizione:

"Il sistema informativo è un insieme organizzato in modo organizzativo di documenti (matrici di documenti) e tecnologie dell'informazione, compreso l'uso della tecnologia informatica e della comunicazione, realizzando processi di informazione"

Classificazione della scala

Per scala, i sistemi informativi sono suddivisi nei seguenti gruppi:

* singolo;

* gruppo;

* aziendale.

Un sistema informativo aziendale è un sistema scalabile progettato per l'automazione integrata di tutti i tipi di attività economiche di grandi e medie imprese, comprese le società costituite da un gruppo di società che richiedono una gestione unificata.

Un sistema informativo aziendale può essere considerato un sistema che automatizza oltre l'80% delle divisioni aziendali.

Recentemente, in molte pubblicazioni dedicate all'uso della tecnologia dell'informazione nella gestione di oggetti economici, viene spesso utilizzato il termine "sistemi informativi aziendali", che in esse significa i veri e propri sistemi informativi automatizzati di oggetti economici.

Un sistema informativo automatizzato (AIS) è una combinazione di vari tipi di supporto, nonché di specialisti progettati per automatizzare l'elaborazione delle informazioni contabili e analitiche. Di norma, i tipi di sicurezza sono omogenei per i diversi sistemi, il che consente di implementare il principio di compatibilità dei sistemi nel corso del loro funzionamento. Nel processo di studio dell'AIS come sistema complesso, è necessario individuare singole parti ed elementi e considerare le caratteristiche del loro utilizzo nelle fasi di creazione e funzionamento.

I sistemi informativi aziendali sono un'evoluzione dei sistemi per gruppi di lavoro, sono focalizzati su grandi aziende e possono supportare nodi o reti dislocati geograficamente. Fondamentalmente, hanno una struttura gerarchica di diversi livelli. Tali sistemi sono caratterizzati da un'architettura client-server con una specializzazione di server o un'architettura multi-tier. Quando si sviluppano tali sistemi, è possibile utilizzare gli stessi server di database come durante lo sviluppo di sistemi informativi di gruppo. Tuttavia, nei sistemi informativi di grandi dimensioni, i server più comuni sono Oracle, DB2 e Microsoft SQL Server.

Per i sistemi di gruppo e aziendali, i requisiti per l'affidabilità del funzionamento e la sicurezza dei dati sono notevolmente aumentati. Queste proprietà vengono fornite mantenendo l'integrità di dati, riferimenti e transazioni nei server di database.

Classificazione per ambito

In base all'ambito di applicazione, i sistemi informativi sono generalmente suddivisi in quattro gruppi:

* sistemi di elaborazione delle transazioni;

* sistemi decisionali;

* informazioni e sistemi di riferimento;

* sistemi informativi d'ufficio.

Bibliografia

1. Agaltsov, V.P. Banca dati. In 2 volumi T. 2. Database distribuiti e remoti: Textbook / V.P. Agaltsov. - M.: ID FORUM, NITs INFRA-M, 2013.

2. Golitsyna, O. L. Database: Libro di testo / O.L. Golitsyna, N.V. Maksimov, I.I. Popov. - M.: Forum, 2012.

3. Karpova, I.P. Database: Libro di testo / I.P. Karpov. - SPb.: Peter, 2013.

4. Kirillov, V.V. Introduzione ai database relazionali Introduzione ai database relazionali. Kirillov, G.Yu. Gromov. - SPb.: BHV-Pietroburgo, 2012.

5. Pirogov, V.Yu. Sistemi informativi e banche dati: organizzazione e progettazione: Libro di testo / V.Yu. Pirogov. - SPb.: BHV-Pietroburgo, 2009.

6. G.N. Fedorov. Sistemi di informazione. - M.: Academy, 2013.

7. A.E. Satunina, L.A. Sysoeva. Project management del sistema informativo aziendale dell'impresa. - M .: Finanza e statistica, Infra-M, 2009.

Pubblicato su Allbest.ru

...

Documenti simili

L'essenza e le caratteristiche dei tipi di modelli di dati: gerarchico, di rete e relazionale. Concetti di base del modello dati relazionale. Attributi, schema di relazione del database. Condizioni di integrità dei dati. Relazioni tra tabelle. Comprensione generale del modello di dati.

term paper aggiunto il 29/01/2011

Sistemi informativi e database aziendali, loro utilizzo per migliorare ed eseguire il debug del business. Classificazione dei sistemi informativi aziendali. Sistemi informativi di classe OLTP. Elaborazione analitica rapida.

term paper, aggiunto il 19/01/2011

Database con file bidimensionali e sistemi di gestione di database relazionali (DBMS). Creazione di un database ed elaborazione delle loro richieste utilizzando un DBMS. Tipi di base di database. Concetti di base dei database relazionali. Proprietà fondamentali delle relazioni.

abstract, aggiunto il 20/12/2010

Concetto di sistema di database. Il modello relazionale e le sue caratteristiche. Integrità nel modello relazionale. Algebra relazionale. Problemi di progettazione del database. Forme normali di relazione. Progettazione di database utilizzando il metodo entità-relazione. Diagrammi ER. Linguaggio SQL.

un corso di lezioni aggiunto il 10/03/2008

Una struttura logica definita di dati archiviata in un database. Modelli di dati di base. Elementi del modello dati relazionale. Un esempio di utilizzo di chiavi esterne. Requisiti di base per la relazione del modello dati relazionale.

presentazione aggiunta il 14/10/2013

Database e loro utilizzo nell'informatica. Caratteristiche e elementi costitutivi di base del modello di dati di rete. Modello gerarchico, oggetti dell'area tematica. Modello relazionale, sua visibilità, presentazione dei dati in forma tabellare.

abstract, aggiunto il 19/12/2011

Tipi e funzioni del sistema di gestione del database di Microsoft Access. Modello gerarchico, di rete, relazionale per la descrizione dei database. Concetti di base delle tabelle di database. Caratteristiche di creazione di oggetti di database, moduli di base. Accesso a Internet in Access.

test, aggiunto il 01/08/2011

Sistemi di gestione database moderni (DBMS). Analisi del modello gerarchico dei dati. Modello di dati relazionali. Modello di dati post-relazionale come modello relazionale esteso che rimuove la restrizione sull'indivisibilità dei dati archiviati nei record della tabella.

lavoro scientifico, aggiunto il 06/08/2010

Modelli di dati nella gestione dei database. Modelli di dati concettuali. Il ruolo delle banche dati nei sistemi informativi. Modello di dati relazionali. Definizione dell'area tematica. Costruzione di un modello di database per il sistema informativo "Animali domestici".

term paper, aggiunto il 19/04/2011

Modello informativo in Access come una sorta di sostituto semplificato di un oggetto o sistema reale. Strutture di base che determinano l'organizzazione dei dati e le relazioni tra loro; un tipo relazionale di organizzazione dei dati. Un esempio di database in fiscalità.

LA CAMPANA

Modello di dati aziendali

introduzione

Modello di dati aziendali

Livelli di presentazione del modello di dati aziendali

ARGOMENTO V. DATABASE AZIENDALI

Potenziali clienti per il data warehouse aziendale e cosa ottengono?

Cos'è un data warehouse aziendale

Aspetto dei componenti di un data warehouse aziendale (modello di dati, processi ETL, data mart)

Software e hardware correlati

Inviare il tuo buon lavoro nella knowledge base è semplice. Utilizza il modulo sottostante

1. Modello dati relazionale

2. Sistemi informativi aziendali

sistema dati modello relazionale

Un sistema (dal greco systema - un intero composto composto da parti) è un insieme di elementi che interagiscono tra loro, formando una certa integrità, unità. Ecco alcuni concetti che vengono spesso utilizzati per caratterizzare un sistema.

1. Elemento di sistema - una parte del sistema che ha uno scopo funzionale specifico. Gli elementi complessi dei sistemi, a loro volta, costituiti da elementi interconnessi più semplici, sono spesso chiamati sottosistemi.

2. Organizzazione del sistema: ordine interno, coerenza dell'interazione degli elementi del sistema, manifestata, in particolare, nel limitare la varietà degli stati degli elementi all'interno del sistema.

4. Architettura di sistema: un insieme di proprietà di sistema essenziali per l'utente.

5. Integrità del sistema - l'irriducibilità fondamentale delle proprietà del sistema alla somma delle proprietà dei suoi singoli elementi (comparsa delle proprietà) e, allo stesso tempo, la dipendenza delle proprietà di ogni elemento dalla sua posizione e funzione all'interno del sistema.

Il sistema informativo è un insieme interconnesso di strumenti, metodi e personale utilizzati per archiviare, elaborare ed emettere informazioni al fine di raggiungere l'obiettivo prefissato "

La legge federale "sull'informazione, l'informatizzazione e la protezione delle informazioni" fornisce la seguente definizione:

"Il sistema informativo è un insieme organizzato in modo organizzativo di documenti (matrici di documenti) e tecnologie dell'informazione, compreso l'uso della tecnologia informatica e della comunicazione, realizzando processi di informazione"

Classificazione della scala

Per scala, i sistemi informativi sono suddivisi nei seguenti gruppi:

* singolo;

* gruppo;

* aziendale.

Un sistema informativo aziendale è un sistema scalabile progettato per l'automazione integrata di tutti i tipi di attività economiche di grandi e medie imprese, comprese le società costituite da un gruppo di società che richiedono una gestione unificata.

Un sistema informativo aziendale può essere considerato un sistema che automatizza oltre l'80% delle divisioni aziendali.

Recentemente, in molte pubblicazioni dedicate all'uso della tecnologia dell'informazione nella gestione di oggetti economici, viene spesso utilizzato il termine "sistemi informativi aziendali", che in esse significa i veri e propri sistemi informativi automatizzati di oggetti economici.

Per i sistemi di gruppo e aziendali, i requisiti per l'affidabilità del funzionamento e la sicurezza dei dati sono notevolmente aumentati. Queste proprietà vengono fornite mantenendo l'integrità di dati, riferimenti e transazioni nei server di database.

Classificazione per ambito

In base all'ambito di applicazione, i sistemi informativi sono generalmente suddivisi in quattro gruppi:

* sistemi di elaborazione delle transazioni;

* sistemi decisionali;

* informazioni e sistemi di riferimento;

* sistemi informativi d'ufficio.

Bibliografia

Documenti simili

Leggi anche

App di editing audio per Android

Utilizzo di programmi di terze parti

Software di animazione 2D

LA CAMPANA