LA CAMPANA

C'è chi legge queste notizie prima di te.
Iscriviti per ricevere articoli freschi.
E-mail
Nome
cognome
Come vuoi leggere The Bell
No spam

Invia una soluzione    Rispondiamo nei giorni feriali
   entro un'ora

Andrey Olovyannikov,[e-mail protetta]il sito

Siamo d'accordo ...

Lo scopo di questo articolo non è uno studio dettagliato di vari sistemi di archiviazione dei dati (SHD). Non analizzeremo tutti i tipi di interfacce - software e hardware - che vengono utilizzati per creare diversi modi di archiviare i dati. Non prenderemo in considerazione i colli di bottiglia di vari tipi di sistemi di archiviazione. Qui non vedrai una discussione dettagliata dei protocolli iSCSI e della loro implementazione sotto forma di FC (Fibre Channel), SCSI, ecc.

Il nostro compito è molto più modesto: basta "Concordare sulla terminologia" con il nostro potenziale acquirente. Quindi due fisici, prima di iniziare una discussione su un problema, raggiungono un accordo su quale processo o fenomeno designeranno con una o un'altra parola. Ciò è necessario per risparmiare tempo e cellule nervose l'uno dell'altro e per condurre una conversazione in modo più produttivo e per piacere reciproco.

SHD o ... SHD?

Cominciamo, come si suol dire, dall'inizio.

Per sistemi di archiviazione, intendiamo ancora i sistemi di archiviazione dei dati come un insieme di strumenti software e hardware che fungono da modo affidabile, rapido e semplice per archiviare e accedere ai dati per le organizzazioni a vari livelli di funzionalità sia finanziarie sia strutturali. Desideriamo immediatamente attirare la vostra attenzione sul fatto che diverse società hanno esigenze diverse per la memorizzazione delle informazioni in una forma o nell'altra e diverse opportunità finanziarie per la loro attuazione. Ma in ogni caso, vogliamo notare che, indipendentemente da quanti soldi o specialisti di questo o quel livello ci siano a disposizione dell'acquirente, insistiamo sul fatto che tutte le loro esigenze si adattino alla nostra definizione di sistemi di archiviazione, sia che si tratti di un normale set di dischi di grandi dimensioni o di una complessa struttura PCS multilivello (Parallels Cloud Storage). Questa definizione, a nostro avviso, include un'altra abbreviazione ampiamente usata tradotta in inglese - SHD come Storage Area Network (SAN). Di seguito illustreremo un po 'la SAN quando parliamo di modi tipici per implementare l'archiviazione.

Il modo più tipico e comprensibile per eseguire l'archiviazione è DAS - Direct Attached Storages - unità che si collegano direttamente al computer che controlla il funzionamento di queste unità.

L'esempio più semplice di DAS è un tipico computer con un disco rigido o un'unità dati DVD (CD) installata al suo interno. Un esempio più complicato (vedi Fig.) È un dispositivo di archiviazione esterno (disco rigido esterno, scaffale del disco, unità nastro, ecc.) Che comunica direttamente con un computer attraverso un protocollo e un'interfaccia specifici (SCSI, eSATA, FC, ecc.). d.). Offriamo scaffali su disco o Data Storage Server come un altro dispositivo di archiviazione DAS (un'altra abbreviazione di SHD).

Il server di archiviazione in questo caso indica un computer con un proprio processore, sistema operativo e memoria sufficiente per elaborare grandi quantità di dati memorizzati su numerosi dischi all'interno del server.

Va notato che con una tale forma di realizzazione del sistema di archiviazione, solo un computer con DAS vede direttamente i dati, tutti gli altri utenti hanno accesso ai dati solo con il "permesso" di questo computer.

Puoi vedere le configurazioni di base della memoria DAS in

Sistemi di archiviazioneNAS

Un'altra implementazione abbastanza semplice dello storage - NAS (Network Attached Storage) - Network Storage (di nuovo la stessa abbreviazione di storage).

Come risulta chiaro, l'accesso ai dati viene effettuato tramite protocolli di rete, di norma, attraverso una LAN di computer a noi familiare (anche se gli accessi più complessi ai dati memorizzati su risorse di rete sono già diventati diffusi). L'esempio più comprensibile e più semplice di archiviazione NAS è un archivio domestico di musica e film, a cui possono accedere contemporaneamente più utenti della rete domestica.

Il NAS memorizza i dati sotto forma di un file system e, di conseguenza, fornisce l'accesso alle risorse tramite protocolli di file di rete (NFS, SMB, AFP ...).

Un semplice esempio di implementazione dello storage NAS è mostrato in fig. 2.

Vogliamo notare subito che il NAS, in linea di principio, può essere considerato qualsiasi dispositivo intelligente che abbia un proprio processore, memoria e interfacce di rete abbastanza veloci per la trasmissione di dati su una rete a diversi utenti. Inoltre, è necessario prestare particolare attenzione alla velocità del sottosistema del disco. È possibile visualizzare le configurazioni più tipiche dei dispositivi NAS in

Storage Area Network - uno dei modi per implementare l'archiviazione come sistema di archiviazione dei dati - vedi sopra.

Questa soluzione software, hardware e architetturale per il collegamento di vari dispositivi di archiviazione in modo tale che il sistema operativo "veda" questi dispositivi come locali. Ciò si ottiene collegando questi dispositivi ai server appropriati. I dispositivi stessi possono essere diversi: array di dischi, librerie di nastri, array di unità ottiche.

Con lo sviluppo di tecnologie di archiviazione, la distinzione tra sistemi SAN e NAS è diventata abbastanza arbitraria. Convenzionalmente, possono essere distinti dal metodo di archiviazione dei dati: SAN - dispositivi a blocchi, NAS - file system di dati.

I protocolli per l'implementazione dei sistemi SAN possono essere diversi: Fibre Channel, iSCSI, AoE.

Uno dei metodi architettonici per l'implementazione della SAN è mostrato in Fig. 3.

Esempi tipici di archiviazione SAN sono disponibili in

In conclusione, esprimiamo l'augurio di essere in grado di "concordare la terminologia" con te e resta solo da discutere le opzioni per la creazione di spazio di archiviazione per la tua attività e selezionare soluzioni che siano adatte a te in termini di affidabilità, semplicità e budget.

Nel caso più semplice, una SAN è costituita da sistemi di archiviazione, switch e server collegati tramite canali di comunicazione ottica. Oltre ai sistemi di archiviazione su disco direttamente, le SAN possono anche collegare librerie di dischi, librerie di nastri (unità nastro), dispositivi per la memorizzazione di dati su dischi ottici (CD / DVD, ecc.), Ecc.

Un esempio di infrastruttura altamente affidabile in cui i server sono connessi contemporaneamente a una rete locale (a sinistra) e a una rete di archiviazione (a destra). Un tale schema fornisce l'accesso ai dati situati sul sistema di archiviazione in caso di guasto di qualsiasi modulo del processore, switch o percorso di accesso.

L'utilizzo di SAN consente di fornire:

  • gestione centralizzata delle risorse di server e sistemi di archiviazione;
  • connessione di nuovi array di dischi e server senza interrompere il funzionamento dell'intero sistema di archiviazione;
  • utilizzo di apparecchiature precedentemente acquistate in combinazione con nuovi dispositivi di archiviazione dei dati;
  • accesso rapido e affidabile ai dispositivi di archiviazione dei dati situati a grande distanza dai server * senza significative perdite di prestazioni;
  • accelerare il processo di backup e ripristino - BURA.

  La storia

Lo sviluppo di tecnologie di rete ha portato alla nascita di due soluzioni di rete per sistemi di archiviazione: Storage Area Networks (SAN) per lo scambio di dati a livello di blocco supportato da file system client e server per l'archiviazione di dati a livello di file Network Attached Storage (NAS). Per distinguere l'archiviazione tradizionale dalla rete, è stato proposto un altro retronym: Direct Attached Storage (DAS).

DAS, SAN e NAS che sono apparsi sul mercato riflettono in sequenza le catene in evoluzione di collegamenti tra applicazioni che utilizzano dati e byte su un supporto contenente questi dati. Una volta, i programmi applicativi stessi leggevano e scrivevano blocchi, quindi i driver apparivano come parte del sistema operativo. Nei moderni DAS, SAN e NAS, la catena è composta da tre collegamenti: il primo è la creazione di array RAID, il secondo è l'elaborazione di metadati per interpretare i dati binari sotto forma di file e record, e il terzo è i servizi per fornire dati all'applicazione. Si differenziano per dove e come vengono implementati questi collegamenti. Nel caso di DAS, l'archiviazione è "nuda", fornisce solo la possibilità di archiviare e accedere ai dati e tutto il resto viene eseguito sul lato server, a partire da interfacce e driver. Con l'avvento della SAN, il provisioning RAID si sposta sul lato storage; tutto il resto rimane lo stesso di DAS. E il NAS è diverso in quanto i metadati vengono anche trasferiti al sistema di archiviazione per garantire l'accesso ai file, qui il client deve solo supportare i servizi dati.

L'emergere di SAN è stato reso possibile dopo lo sviluppo del protocollo Fibre Channel (FC) nel 1988 e l'ANSI è stato approvato come standard nel 1994. Il termine Storage Area Network risale al 1999. Nel tempo, l'FC ha lasciato il posto a Ethernet e divenne IP-SAN diffuso con connettività iSCSI.

L'idea di un server di archiviazione di rete NAS appartiene a Brian Randall dell'Università di Newcastle ed è stata implementata in macchine su un server UNIX nel 1983. Questa idea si è rivelata un tale successo che è stata ripresa da molte aziende, tra cui Novell, IBM e Sun, ma alla fine ha sostituito i leader di NetApp ed EMC.

Nel 1995, Garth Gibson ha sviluppato i principi del NAS e creato Object Storage Systems (OBS). Ha iniziato dividendo tutte le operazioni del disco in due gruppi, uno dei quali includeva operazioni eseguite più frequentemente, come lettura e scrittura, e l'altro, più rare, come le operazioni con nomi. Quindi ha proposto oltre a bloccare e archiviare un altro contenitore, lo ha definito un oggetto.

OBS si distingue per un nuovo tipo di interfaccia, si chiama interfaccia dell'oggetto. I servizi dati client interagiscono con i metadati mediante l'API Object. OBS non solo memorizza i dati, ma supporta anche RAID, archivia i metadati relativi agli oggetti e supporta l'interfaccia degli oggetti. DAS, SAN, NAS e OBS coesistono nel tempo, ma ciascuno dei tipi di accesso corrisponde più da vicino a un determinato tipo di dati e applicazioni.

  Architettura SAN

  Topologia di rete

SAN è una rete di dati ad alta velocità progettata per connettere i server ai dispositivi di archiviazione. Una varietà di topologie SAN (point-to-point, Arbitrated Loop e switching) sostituisce le tradizionali connessioni bus da server a storage e offre maggiore flessibilità, prestazioni e affidabilità rispetto ad esse. La base del concetto SAN è la capacità di connettere qualsiasi server a qualsiasi dispositivo di archiviazione dati che utilizza il protocollo Fibre Channel. Il principio di interazione dei nodi in una SAN con topologie punto-punto o di commutazione è mostrato nelle figure. In una SAN con topologia a ciclo arbitrario, i dati vengono trasferiti in sequenza da nodo a nodo. Per avviare il trasferimento dei dati, il dispositivo di trasmissione avvia l'arbitrato per il diritto di utilizzare il supporto di trasmissione dei dati (da cui il nome della topologia - Arbitrated Loop).

Il trasporto SAN si basa sul protocollo Fibre Channel, utilizzando connessioni sia in rame che in fibra ottica.

  Componenti SAN

I componenti SAN sono suddivisi nei seguenti:

  • Risorse di archiviazione dati;
  • Dispositivi che implementano l'infrastruttura SAN;

  Adattatori bus host

  Risorse per l'archiviazione dei dati

Le risorse di archiviazione includono array di dischi, unità nastro e librerie Fibre Channel. Le risorse di archiviazione realizzano molte delle loro capacità solo quando sono incluse nella SAN. In questo modo gli array di dischi di prima classe possono replicare i dati tra array su reti Fibre Channel e le librerie di nastri possono trasferire i dati su nastro direttamente dagli array di dischi con interfaccia Fibre Channel, bypassando la rete e i server (backup senza server). I più popolari sul mercato sono array di dischi di EMC, Hitachi, IBM, Compaq (la famiglia Storage Works, ereditata da Compaq di Digital), e dei produttori di librerie di nastri che dovremmo menzionare StorageTek, Quantum / ATL, IBM.

  Dispositivi per infrastrutture SAN

I dispositivi SAN includono switch Fibre Channel (switch FC), hub (Fibre Channel Hub) e router (router Fibre Channel-SCSI) Gli hub vengono utilizzati per combinare i dispositivi Fibre Channel Arbitrated Loop (FC_AL). ). L'uso di hub consente di connettere e disconnettere i dispositivi nel loop senza arrestare il sistema, poiché l'hub chiude automaticamente il loop se il dispositivo è spento e disconnette automaticamente il loop se un nuovo dispositivo è stato collegato ad esso. Ogni modifica del loop è accompagnata da un processo complesso della sua inizializzazione. Il processo di inizializzazione è a più stadi e fino al suo completamento è impossibile lo scambio di dati nel loop.

Tutte le SAN moderne sono basate su switch che consentono di implementare una connessione di rete completa. Gli switch possono non solo collegare i dispositivi Fibre Channel, ma anche differenziare l'accesso tra i dispositivi, per i quali vengono create le cosiddette zone sugli switch. I dispositivi collocati in zone diverse non possono scambiarsi informazioni. Il numero di porte in una SAN può essere aumentato collegando gli switch tra loro. Un gruppo di switch correlati è chiamato Fabric Fibre Channel o semplicemente Fabric. Le connessioni tra switch sono chiamate Interswitch Links, o ISL in breve.

  software

Il software consente la prenotazione dei percorsi di accesso al server agli array di dischi e il bilanciamento dinamico del carico tra i percorsi. Per la maggior parte degli array di dischi, esiste un modo semplice per determinare che le porte disponibili attraverso controller diversi appartengono allo stesso disco. Software specializzato mantiene una tabella dei percorsi di accesso ai dispositivi e fornisce la disconnessione dei percorsi in caso di incidente, la connessione dinamica di nuovi percorsi e il bilanciamento del carico tra di essi. Di norma, i produttori di array di dischi offrono software specializzati di questo tipo per i loro array. Il software VERITAS produce il software VERITAS Volume Manager progettato per organizzare volumi di dischi logici da dischi fisici e fornire percorsi di accesso ai dischi di backup, nonché il bilanciamento del carico tra di essi per la maggior parte degli array di dischi noti.

  Protocolli utilizzati

Le reti di archiviazione utilizzano protocolli di basso livello:

  • Fibre Channel Protocol (FCP), trasporto SCSI su Fibre Channel. Il protocollo più comunemente usato al momento. Sono disponibili opzioni per 1 Gbit / s, 2 Gbit / s, 4 Gbit / s, 8 Gbit / se 10 Gbit / s.
  • iSCSI, trasporto SCSI su TCP / IP.
  • FCoE, che trasporta FCP / SCSI su Ethernet pura.
  • FCIP e iFCP, incapsulamento e trasmissione di FCP / SCSI in pacchetti IP.
  • HyperSCSI, trasporto SCSI su Ethernet.
  • Trasporto FICON tramite Fibre Channel (utilizzato solo dai mainframe).
  • ATA su Ethernet, trasporto ATA su Ethernet.
  • Trasporto SCSI e / o TCP / IP tramite InfiniBand (IB).

  I benefici

  • Elevata affidabilità di accesso ai dati situati su sistemi di archiviazione esterni. Indipendenza della topologia SAN da sistemi e server di archiviazione usati.
  • Archiviazione dati centralizzata (affidabilità, sicurezza).
  • Comoda gestione centralizzata di commutazione e dati.
  • Trasferisci traffico I / O intensivo su una rete separata - Offload LAN.
  • Alta velocità e bassa latenza.
  • Scalabilità e flessibilità della struttura logica SAN
  • Le dimensioni geografiche della SAN, in contrasto con il classico DAS, sono praticamente illimitate.
  • La capacità di distribuire rapidamente le risorse tra i server.
  • La capacità di creare soluzioni cluster tolleranti ai guasti senza costi aggiuntivi basati sulla SAN esistente.
  • Semplice schema di backup: tutti i dati sono in un unico posto.
  • Disponibilità di funzionalità e servizi aggiuntivi (istantanee, replica remota).
  • SAN ad alta sicurezza.

La condivisione dei sistemi di archiviazione in genere semplifica l'amministrazione e aggiunge una notevole flessibilità poiché i cavi e gli array di dischi non devono essere trasportati fisicamente e passati da un server a un altro.

Un altro vantaggio è la possibilità di caricare i server direttamente dalla rete di archiviazione. Con questa configurazione, è possibile sostituire rapidamente e facilmente una non riuscita.

Se i server sono dispositivi universali che funzionano nella maggior parte dei casi
   - la funzione del server delle applicazioni (quando sul server vengono eseguiti programmi speciali e vengono eseguiti calcoli intensivi),
   - una funzione del file server (ovvero un determinato posto per l'archiviazione centralizzata dei file di dati)

quindi SHD (Data Storage Systems) - dispositivi appositamente progettati per eseguire funzioni server come l'archiviazione dei dati.

La necessità di archiviazione
   di solito insorge in imprese sufficientemente mature, ad es. quelli che pensano a come
   - archiviare e gestire le informazioni, la risorsa più preziosa dell'azienda
   - assicurare la continuità aziendale e la protezione dalla perdita di dati
   - aumentare l'adattabilità dell'infrastruttura IT

Archiviazione e virtualizzazione
   La concorrenza obbliga le PMI a lavorare in modo più efficiente, senza tempi di fermo e con alta efficienza. Il cambiamento di modelli di produzione, piani tariffari, tipi di servizi avviene sempre più spesso. L'intero business delle aziende moderne è "legato" alla tecnologia dell'informazione. Le esigenze aziendali cambiano rapidamente e incidono immediatamente sull'IT: i requisiti di affidabilità e adattabilità dell'infrastruttura IT sono in crescita. La virtualizzazione offre queste funzionalità, ma richiede sistemi di archiviazione economici e di facile manutenzione.

Classificazione di archiviazione per tipo di connessione

DAS. I primi array di dischi collegati ai server tramite SCSI. Allo stesso tempo, un server potrebbe funzionare con un solo array di dischi. Questa è una connessione di archiviazione diretta (DAS - Direct Attached Storage).

NAS. Per un'organizzazione più flessibile della struttura del data center, in modo che ogni utente possa utilizzare qualsiasi sistema di archiviazione, è necessario connettere il sistema di archiviazione alla rete locale. Questo è NAS - Network Attached Storage). Ma lo scambio di dati tra il server e il sistema di archiviazione è molte volte più intenso che tra il client e il server, pertanto, in questa versione c'erano delle difficoltà oggettive associate alla larghezza di banda della rete Ethernet. E dal punto di vista della sicurezza, non è del tutto corretto mostrare i sistemi di archiviazione in una rete comune.

SAN. Ma puoi creare la tua rete separata, ad alta velocità tra server e storage. Tale rete era chiamata SAN (Storage Area Network). Le prestazioni sono assicurate dal fatto che il mezzo di trasmissione fisico è dotato di ottica. Adattatori speciali (HBA) e switch FC ottici forniscono la trasmissione di dati a velocità di 4 e 8 Gbit / s. L'affidabilità di tale rete è stata migliorata dalla ridondanza (duplicazione) dei canali (adattatori, switch). Lo svantaggio principale è il prezzo elevato.

iSCSI. Con l'avvento delle tecnologie Ethernet a basso costo 1 Gbit / se 10 Gbit / s, le ottiche con una velocità di trasmissione di 4 Gbit / s non sembrano più così attraenti, soprattutto considerando il prezzo. Pertanto, il protocollo iSCSI (Internet Small Computer System Interface) viene sempre più utilizzato come ambiente SAN. Una SAN iSCSI può essere costruita su qualsiasi base fisica abbastanza veloce che supporti il \u200b\u200bprotocollo IP.

Classificazione dei sistemi di archiviazione per applicazione:

   la classe    la descrizione
   personale

Molto spesso si tratta di un normale disco rigido da 3,5 "o 2,5" o 1,8 ", inserito in una custodia speciale e dotato di interfacce USB e / o FireWire 1394 e / o Ethernet e / o eSATA.
   Pertanto, disponiamo di un dispositivo portatile in grado di connettersi a un computer / server ed eseguire le funzioni di un'unità esterna. A volte, per comodità, accesso wireless, stampante e porte USB vengono aggiunte al dispositivo.

   piccolo gruppo di lavoro

In genere, si tratta di un dispositivo fisso o portatile in cui è possibile installare diversi dischi rigidi SATA (più spesso da 2 a 5), \u200b\u200bcon o senza hot-swap, con un'interfaccia Ethernet. I dischi possono essere organizzati in array RAID di vari livelli per ottenere un'elevata affidabilità di archiviazione e velocità di accesso. Il sistema di archiviazione ha un sistema operativo specializzato, generalmente basato su Linux, e consente di differenziare il livello di accesso per nome utente e password, organizzare quote per spazio su disco, ecc.
   Tali sistemi di archiviazione sono adatti per piccoli gruppi di lavoro, come la sostituzione di file server.

gruppo di lavoro

Il dispositivo è in genere montato su un rack da 19 "(montaggio in rack) in cui è possibile installare unità HotSwap hot-swap SATA o SAS 12-24. Ha un'interfaccia Ethernet e / o iSCSI esterna. Le unità sono organizzate in array RAID per raggiungere affidabilità dello spazio di archiviazione e velocità di accesso Lo spazio di archiviazione viene fornito con un software specializzato che consente di differenziare i livelli di accesso, organizzare le quote per lo spazio su disco, organizzare il backup (informazioni sul backup), ecc.
   Tali sistemi di archiviazione sono adatti per medie e grandi aziende e vengono utilizzati insieme a uno o più server.
   impresa
   Un dispositivo fisso o un dispositivo montato in un rack da 19 "(montaggio in rack) in cui è possibile installare fino a centinaia di dischi rigidi.
   Oltre alla classe precedente, i sistemi di archiviazione possono avere la capacità di creare, aggiornare e sostituire componenti senza arrestare il sistema di monitoraggio. Il software può supportare snapshot e altre funzionalità avanzate.
   Questi sistemi di archiviazione sono adatti per le grandi aziende e offrono maggiore affidabilità, velocità e protezione dei dati critici.

impresa di fascia alta

Oltre alla classe precedente, l'archiviazione può supportare migliaia di dischi rigidi.
   Tali sistemi di stoccaggio occupano diversi armadi da 19 ", il peso totale raggiunge diverse tonnellate.
   I sistemi di archiviazione sono progettati per un funzionamento non-stop con il massimo grado di affidabilità, archiviando dati strategicamente importanti a livello statale / aziendale.

La storia del problema.

I primi server hanno combinato tutte le funzioni (come i computer) in un unico pacchetto: sia informatica (application server) che archiviazione dei dati (file server). Ma poiché la domanda di applicazioni nella potenza di elaborazione cresce da un lato e mentre la quantità di dati elaborati cresce dall'altro lato, è diventato semplicemente scomodo mettere tutto in un unico pacchetto. Si è rivelato più efficiente estrarre array di dischi in casi separati. Ma qui è nata la domanda di collegare l'array di dischi al server. I primi array di dischi collegati ai server tramite SCSI. Ma in questo caso, un server potrebbe funzionare con un solo array di dischi. Le persone desideravano un'organizzazione più flessibile della struttura del data center, in modo che qualsiasi server potesse utilizzare qualsiasi sistema di archiviazione. Connettere tutti i dispositivi direttamente alla rete locale e organizzare lo scambio di dati via Ethernet è, ovviamente, una soluzione semplice e universale. Ma lo scambio di dati tra server e storage è molte volte più intenso che tra client e server, quindi in questa versione (NAS - vedi sotto) c'erano delle difficoltà oggettive associate alla larghezza di banda della rete Ethernet. Si è pensato di creare una rete ad alta velocità separata tra server e storage. Tale rete era chiamata SAN (vedi sotto). È simile a Ethernet, solo il mezzo di trasmissione fisico è dotato di ottica. Esistono anche adattatori (HBA) installati in server e switch (ottica). Standard per la velocità di trasmissione dei dati per l'ottica - 4Gbit / s. Con l'avvento delle tecnologie Ethernet 1Gbit / se 10Gbit / s, nonché del protocollo iSCSI, Ethernet viene sempre più utilizzata come ambiente SAN.

La dipendenza dei processi aziendali dall'IT è in costante crescita. Oggi, la questione della continuità del servizio IT viene prestata attenzione non solo alle grandi aziende, ma anche ai rappresentanti delle medie e spesso delle piccole imprese.

Uno degli elementi centrali per garantire la tolleranza agli errori è un sistema di archiviazione dei dati (SHD), un dispositivo su cui vengono archiviate centralmente tutte le informazioni. Lo stoccaggio è caratterizzato da elevata scalabilità, tolleranza ai guasti, capacità di eseguire tutte le operazioni di manutenzione senza interrompere il funzionamento del dispositivo (inclusa la sostituzione dei componenti). Ma il costo anche del modello base è misurato in decine di migliaia di dollari. Per esempio Fujitsu ETERNUS DX100   con 12 unità Nearline SAS 1Tb SFF (RAID10 6TB)   vale la pena 21000 USDquello per una piccola azienda è molto costoso.

Nel nostro articolo, proponiamo di considerare opzioni di archiviazione del budgetche non perde in termini di prestazioni e affidabilità rispetto ai sistemi classici. Per la sua implementazione, ti consigliamo di utilizzare CEPH.

Cos'è CEPH e come funziona?

CEPH   - archiviazione basata su software libero, è una combinazione degli spazi su disco di più server (il numero di server in pratica è misurato in decine e centinaia). CEPH consente di creare storage altamente scalabile con elevate prestazioni e ridondanza delle risorse. CEPH può essere utilizzato sia come archivio di oggetti (per servire per la memorizzazione di file) sia come dispositivo a blocchi (restituzione di dischi rigidi virtuali).

La tolleranza ai guasti dell'archiviazione è garantita dalla replica di ciascun blocco di dati su più server. Il numero di copie memorizzate simultaneamente di ciascun blocco è chiamato fattore di replica, per impostazione predefinita il suo valore è 2. Lo schema delle operazioni di archiviazione è mostrato nella Figura 1, come puoi vedere, le informazioni sono divise in blocchi, ognuno dei quali è distribuito su due nodi diversi.

Figura 1 - Distribuzione di blocchi di dati


Se i server non utilizzano array di dischi con tolleranza agli errori, si consiglia di utilizzare un valore più elevato del fattore di replica per un'archiviazione affidabile dei dati. In caso di guasto di uno dei server, CEPH corregge l'inaccessibilità dei blocchi di dati (Figura 2) che si trovano su di esso, attende per un certo tempo (il parametro è configurato, per impostazione predefinita 300 secondi), dopo di che inizia a ricreare i blocchi di informazioni mancanti in un altro posto (Figura 3 ).

Figura 2 - Errore di un nodo


Figura 3 - Ripristino ridondanza


Allo stesso modo, se un nuovo server viene aggiunto al cluster, la memoria viene ribilanciata per riempire uniformemente i dischi su tutti i nodi. Il meccanismo che controlla la distribuzione dei blocchi di informazioni in un cluster CEPH è chiamato CRUSH.

Per ottenere spazio su disco ad alte prestazioni nei cluster CEPH, si consiglia di utilizzare la funzionalità di tiering della cache (cache multilivello). Il suo significato è creare un pool separato ad alte prestazioni e utilizzarlo per la memorizzazione nella cache, ma le informazioni principali verranno posizionate su dischi più economici (Figura 4).

Figura 4 - Rappresentazione logica dei pool di dischi


La memorizzazione nella cache multilivello funzionerà come segue: le richieste di scrittura dei client verranno registrate nel pool più veloce e quindi spostate al livello di archiviazione. Allo stesso modo, per le richieste di lettura, le informazioni durante la chiamata verranno portate al livello della cache ed elaborate. I dati continuano a rimanere a livello di cache fino a quando non diventano inattivi o fino a quando non sono più rilevanti (Figura 5). Vale la pena notare che la memorizzazione nella cache può essere configurata per la sola lettura, in questo caso le richieste di scrittura verranno immesse direttamente nel pool di archiviazione.

Figura 5 - Il principio di funzionamento della cache-thrring


Prendi in considerazione scenari reali per l'utilizzo di CEPH in un'organizzazione per creare un data warehouse. Le organizzazioni di piccole e medie imprese in cui questa tecnologia sarà maggiormente richiesta sono considerate potenziali clienti. Abbiamo calcolato 3 scenari per l'utilizzo della soluzione descritta:

  1. Una società manifatturiera o commerciale con un requisito per la disponibilità di un sistema ERP interno e archiviazione dei file del 99,98% all'anno, 24 ore su 24, 7 giorni su 7.
  2. Un'organizzazione che deve implementare un cloud privato locale per le sue attività aziendali.
  3. Una soluzione a basso costo per l'organizzazione di un data warehouse a blocchi con tolleranza agli errori, completamente indipendente dall'hardware con una disponibilità del 99,98% all'anno e una scalabilità economica.

Scenario di utilizzo 1. Data Warehouse basato su CEPH

Prendi in considerazione un esempio reale di CEPH in un'organizzazione. Ad esempio, abbiamo bisogno di uno storage di produzione con tolleranza agli errori di 6 TB, ma i costi anche per il modello di storage di base con i dischi sono circa $21 000 .

Raccogliamo lo stoccaggio in base al CEPH. Come server suggeriamo di utilizzare una soluzione Supermicro gemello   (Figura 6). Il prodotto è composto da 4 piattaforme server in un unico contenitore con un'altezza di 2 unità, tutti i nodi principali del dispositivo sono duplicati, il che garantisce il suo funzionamento continuo. Per implementare il nostro compito, sarà sufficiente utilizzare 3 nodi, il quarto sarà riservato per il futuro.




Figura 6 - Supermicro Twin


Completiamo ogni nodo nel modo seguente: 32 GB di RAM, un processore a 4 core da 2,5 GHz, 4 dischi SATA da 2 TB ciascuno per un pool di archiviazione sono combinati in 2 array RAID1 e 2 dischi SSD per un pool di cache sono anche combinati in RAID1. Il costo dell'intero progetto è mostrato nella tabella 1.

Tabella 1. Accessori per la conservazione basati su CEPH

accessori Prezzo, USD contare Costo, USD
4 999,28 1 4 999,28
139,28 6 835,68
Processore Ivy Bridge-EP 4-Core 2.5GHz (LGA2011, 10MB, 80W, 22nm) Vassoio 366,00 3 1 098,00
416,00 12 4 992,00
641,00 6 3 846,00
TOTALE 15 770,96

conclusione: Come risultato della creazione dell'archiviazione, otteniamo un array di dischi da 6 TB con i costi dell'ordine $16 000 che 25% in meno   rispetto all'acquisto di spazio di archiviazione minimo, mentre alla capacità attuale è possibile eseguire macchine virtuali che funzionano con l'archiviazione, risparmiando così sull'acquisto di server aggiuntivi. In realtà, questa è una soluzione completa.

I server da cui viene creato lo spazio di archiviazione possono essere utilizzati non solo come spazio di archiviazione per dischi rigidi, ma anche come supporto per macchine virtuali o server applicazioni.

Usa il caso 2: creazione di un cloud privato

La sfida è quella di implementare l'infrastruttura per creare un cloud privato al minor costo.

La costruzione anche di una piccola nuvola costituita, ad esempio, da 3 portatori approssimativamente all'interno $36 000 : $ 21.000 - il costo di archiviazione + $ 5000 per ciascun server con una copertura del 50%.

L'uso di CEPH come memoria consente di combinare risorse di elaborazione e disco sullo stesso hardware. In altre parole, non è necessario acquistare separatamente i sistemi di archiviazione: i dischi installati direttamente nei server verranno utilizzati per ospitare macchine virtuali.

Riferimento rapido:
La classica struttura cloud è un cluster di macchine virtuali, il cui funzionamento è fornito da 2 componenti hardware principali:

  1. Parte di calcolo: server pieni di RAM e processori, le cui risorse sono utilizzate dalle macchine virtuali per i calcoli
  2. Sistema di archiviazione (archiviazione) - un dispositivo pieno di dischi rigidi, che memorizza tutti i dati.

Prendiamo gli stessi server Supermicro delle apparecchiature, ma mettiamo processori più potenti: 8 core con una frequenza di 2,6 GHz e 96 GB di RAM in ciascun nodo, poiché il sistema verrà utilizzato non solo per archiviare informazioni, ma anche per il funzionamento di macchine virtuali. Prendiamo una serie di dischi simili al primo scenario.

Tabella 2. Accessori per un cloud privato basato su CEPH

accessori Prezzo, USD contare Costo, USD
Supermicro Twin 2027PR-HTR: 4 sistemi hot-plug (nodi) in un fattore di forma 2U. Doppia presa R (LGA 2011), fino a 512 GB ECC RDIMM, IPMI 2.0 integrato con KVM e LAN dedicata. 6 alloggiamenti per HDD SATA da 2,5 "hot-swap. Alimentatori ridondanti da 2000 W. 4 999,28 1 4 999,28
Samsung DDR3 16 GB registrato ECC 1866 MHz 1,5 V, modulo di memoria a doppio rango 139,28 18 2 507,04
Processore Intel Xeon E5-2650V2 Ivy Bridge-EP 8-Core 2.6GHz (LGA2011, 20MB, 95W, 32nm) Vassoio 1 416,18 3 4 248,54
SATA 2TB 2,5 "Hard Disk Enterprise Capacità SATA 6Gb / s 7200rpm 128Mb 512E 416 12 4 992,00
SSD 2.5 "" 400GB DC S3710 Series. 641 6 3 846,00
TOTALE 20 592,86

Il cloud raccolto avrà le seguenti risorse, tenendo conto della stabilità in caso di errore del 1 ° nodo:

  • RAM: 120 GB
  • 6.000 GB di spazio su disco
  • Core del processore fisico: 16 pezzi

Il cluster assemblato sarà in grado di supportare circa 10 macchine virtuali medie con le seguenti caratteristiche: 12 GB di RAM / 4 core del processore / 400 GB di spazio su disco.

Vale anche la pena considerare che tutti e 3 i server sono pieni solo del 50% e, se necessario, possono essere a corto di personale, aumentando così il pool di risorse per il cloud di 2 volte.

conclusione:   Come puoi vedere, abbiamo ottenuto sia un cluster di macchine virtuali a tolleranza d'errore completo sia un'archiviazione dei dati ridondante - il fallimento di uno dei server non è critico - il sistema continuerà a funzionare senza arrestarsi, mentre il costo della soluzione è circa 1,5 volte inferioredi acquistare spazio di archiviazione e singoli server.

Scenario di utilizzo 3. Creazione di un data warehouse super economico

Se il budget è completamente limitato e non ci sono soldi per acquistare l'apparecchiatura sopra descritta, è possibile acquistare server usati, ma non si dovrebbe risparmiare sui dischi - si consiglia vivamente di acquistarne di nuovi.

Proponiamo di considerare la seguente struttura: approvvigionamento 4 nodi server, ogni server ha 1 disco SSD per la memorizzazione nella cache e 3 unità SATA. I server Supermicro con 48 GB di RAM e processori serie 5600 possono ora essere acquistati per circa $800 .

I dischi non verranno raccolti in array a tolleranza d'errore su ciascun server, ma verranno presentati come un dispositivo separato. A questo proposito, per aumentare l'affidabilità dell'archiviazione, utilizzeremo il fattore di replica 3. Cioè, ogni blocco avrà 3 copie. Con questa architettura, non è richiesta la cache SSD del mirroring del disco, poiché esiste una duplicazione automatica delle informazioni su altri nodi.

Tabella 3. Accessori per la conservazione

conclusione:   Se necessario, è possibile utilizzare dischi più grandi in questa soluzione o sostituirli con SAS se è necessario ottenere le massime prestazioni per il DBMS. In questo esempio, otteniamo 8 TB di spazio di archiviazione con costi molto bassi e tolleranza ai guasti molto elevata. Il prezzo di un terabyte è 3.8 volte più economicorispetto a quando si utilizza lo storage industriale per $ 21.000.

Tabella riassuntiva, conclusioni

configurazione Memoria per Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) Memoria per Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) + Supermicro Twin Il nostro scenario 1: archiviazione basata su CEPH Il nostro scenario 2: costruire un cloud privato Il nostro scenario 3: creare uno spazio di archiviazione super economico
Volume utile, GB 6 000 6 000 6 000 6000 8 000
Prezzo, USD 21000 36000 15 770 20 592 7 324
Costo 1 GB, USD 3,5 6 2,63 3,43 0,92
Numero di IOP * (lettura 70% / scrittura 30%, dimensione blocco 4K) 760 760 700 700 675
appuntamento deposito Memoria + Calcolo Memoria + Calcolo Memoria + Calcolo Memoria + Calcolo

* Il calcolo del numero di IOP è stato eseguito per gli array creati da dischi NL SAS sul sistema di archiviazione e dischi SATA sull'archivio CEPH, la memorizzazione nella cache è stata disabilitata per la purezza dei valori ottenuti. Quando si utilizza la memorizzazione nella cache, gli IOP saranno significativamente più alti fino a quando la cache non sarà piena.

Di conseguenza, possiamo dire che sulla base del cluster CEPH è possibile costruire data warehouse affidabili ed economici. Come hanno mostrato i calcoli, l'utilizzo dei nodi del cluster solo per lo storage non è molto efficace - la soluzione è più economica dell'acquisto dello storage, ma non di molto - nel nostro esempio, il costo dello storage su CEPH è stato di circa il 25% inferiore rispetto al Fujitsu DX100. I risparmi reali sono percepiti come risultato della combinazione della parte informatica e dello storage sulla stessa apparecchiatura: in questo caso, il costo della soluzione sarà 1,8 volte inferiore rispetto alla costruzione di una struttura classica utilizzando storage dedicato e macchine host separate.

EFSOL implementa questa soluzione in base alle esigenze individuali. Siamo in grado di utilizzare le apparecchiature disponibili, il che ridurrà ulteriormente i costi di capitale per l'implementazione del sistema. Contattaci e esamineremo le tue apparecchiature per il loro utilizzo nella creazione di sistemi di archiviazione.

Come sapete, negli ultimi anni c'è stato un intenso aumento del volume di informazioni e dati accumulati. Uno studio condotto da IDC Digital Universe ha dimostrato che il volume globale di informazioni digitali potrebbe aumentare da 4,4 zettebyte a 44 zettebyte entro il 2020. Secondo gli esperti, ogni due anni la quantità di informazioni digitali raddoppia. Pertanto, oggi il problema non solo dell'elaborazione delle informazioni, ma anche della sua memorizzazione è estremamente urgente.

Per risolvere questo problema, esiste attualmente uno sviluppo molto attivo di settori come lo sviluppo di sistemi di archiviazione (reti / sistemi di archiviazione). Proviamo a capire cosa significa esattamente il moderno settore IT con il concetto di "sistema di archiviazione dei dati".

SHD è una soluzione integrata di software e hardware volta a organizzare l'archiviazione affidabile e di alta qualità di varie risorse di informazioni, nonché a fornire un accesso ininterrotto a tali risorse.

La creazione di un tale complesso dovrebbe aiutare a risolvere una varietà di problemi che affliggono le aziende moderne nel processo di costruzione di un sistema informativo completo.

I principali componenti dello storage:

Dispositivi di archiviazione (libreria a nastro, array di dischi interno o esterno);

Sistema di monitoraggio e controllo;

Sottosistema di backup / archiviazione dei dati;

Software di gestione dello storage;

Accesso all'infrastruttura a tutti i dispositivi di archiviazione.

Compiti principali

Considera le attività più comuni:

Decentramento delle informazioni. Alcune organizzazioni hanno una struttura di filiali sviluppata. Ogni singola unità di tale organizzazione dovrebbe avere libero accesso a tutte le informazioni necessarie per funzionare. I moderni sistemi di archiviazione interagiscono con gli utenti che si trovano a grande distanza dal centro in cui vengono elaborati i dati, quindi sono in grado di risolvere questo problema.

Incapacità di prevedere le risorse finali necessarie. Durante la pianificazione del progetto, può essere estremamente difficile determinare quali volumi di informazioni dovranno funzionare durante il funzionamento del sistema. Inoltre, la massa di dati accumulati è in costante aumento. La maggior parte dei sistemi di archiviazione moderni supporta la scalabilità (la capacità di aumentare le prestazioni dopo l'aggiunta di risorse), quindi la capacità del sistema può essere aumentata in proporzione all'aumento dei carichi (aggiornamento).

Sicurezza di tutte le informazioni memorizzate. Può essere abbastanza difficile da controllare, oltre a limitare l'accesso alle risorse informative di un'azienda. Azioni non qualificate da parte del personale e degli utenti, tentativi deliberati di demolizione: tutto ciò può causare danni significativi ai dati memorizzati. I moderni sistemi di archiviazione utilizzano una varietà di schemi di tolleranza agli errori in grado di resistere sia al sabotaggio deliberato sia alle azioni inettate da parte di dipendenti non qualificati, preservando così le prestazioni del sistema.

La complessità della gestione dei flussi di informazioni distribuite - qualsiasi azione volta a modificare i dati di informazioni distribuite in una delle filiali crea inevitabilmente una serie di problemi - dalla complessità della sincronizzazione di database e versioni differenti dei file degli sviluppatori alla inutile duplicazione delle informazioni. I prodotti software di gestione forniti con i sistemi di archiviazione ti aiuteranno a semplificare e ottimizzare in modo efficiente il lavoro con le informazioni memorizzate.

Costi elevati. Come dimostrato dai risultati di uno studio condotto da IDC Perspectives, i costi di archiviazione dei dati rappresentano circa il 23% di tutti i costi IT. Questi costi includono il costo del software e dell'hardware del complesso, i pagamenti al personale di servizio, ecc. L'uso dei sistemi di archiviazione consente di risparmiare sull'amministrazione del sistema, oltre a ridurre i costi del personale.


   I principali tipi di archiviazione

Tutti i sistemi di archiviazione sono divisi in 2 tipi: archiviazione su nastro e su disco. Ognuna delle due specie sopra è divisa, a sua volta, in diverse sottospecie.

Archiviazione su disco

Tali sistemi di archiviazione dei dati vengono utilizzati per creare copie intermedie di backup, nonché lavori operativi con vari dati.

I sistemi di archiviazione su disco sono suddivisi nelle seguenti sottospecie:

Dispositivi per backup (varie librerie di dischi);

Dispositivi per dati di lavoro (apparecchiature caratterizzate da elevate prestazioni);

Dispositivi utilizzati per l'archiviazione a lungo termine.


Archiviazione su nastro

Utilizzato per creare archivi e backup.

I sistemi di archiviazione su nastro sono suddivisi nelle seguenti sottospecie:

Librerie di nastri (due o più unità, un numero elevato di slot per nastro);

Caricatori automatici (1 unità, diversi slot progettati per nastri);

Unità separate.

  Interfacce di connessione di base

Abbiamo esaminato i principali tipi di sistemi sopra e ora diamo un'occhiata più da vicino alla struttura dei sistemi di archiviazione stessi. I moderni sistemi di archiviazione sono suddivisi in base al tipo di interfacce di connessione host che utilizzano. Considerare di seguito le 2 interfacce di connessione esterna più comuni: SCSI e FibreChannel. L'interfaccia SCSI ricorda l'IDE diffuso ed è un'interfaccia parallela che può ospitare fino a sedici dispositivi sullo stesso bus (per l'IDE, come sapete, due dispositivi per canale). La velocità massima del protocollo SCSI oggi è di 320 megabyte al secondo (una versione che fornirà una velocità di 640 megabyte al secondo è attualmente in fase di sviluppo). Gli svantaggi di SCSI sono i cavi scomodi, senza inceppamenti, eccessivamente spessi, la cui lunghezza massima non supera i venticinque metri. Lo stesso protocollo SCSI impone anche alcune restrizioni - di norma, questo è 1 iniziatore sul bus più slave (streamer, dischi, ecc.).

L'interfaccia FibreChannel viene utilizzata meno frequentemente dell'interfaccia SCSI, poiché le apparecchiature utilizzate per questa interfaccia sono più costose. Inoltre, FibreChannel viene utilizzato per distribuire reti di archiviazione SAN di grandi dimensioni, quindi viene utilizzato solo nelle grandi aziende. Le distanze possono essere praticamente qualsiasi: dai trecento metri standard sulle apparecchiature standard ai duemila chilometri per interruttori potenti ("registi"). Il vantaggio principale dell'interfaccia FibreChannel è la possibilità di combinare molti dispositivi di archiviazione e host (server) in una rete di archiviazione SAN comune. Vantaggi meno importanti sono: maggiori rispetto a SCSI, distanze, capacità di aggregare canali e percorsi di accesso ridondanti, capacità di "hot plug" delle apparecchiature, maggiore immunità al rumore. Vengono utilizzati cavi ottici bipolari e multimodali (con connettori di tipo SC o LC), nonché SFP - trasmettitori ottici realizzati sulla base di emettitori laser o LED (la distanza massima tra i dispositivi utilizzati e la velocità di trasmissione dipende da questi componenti).

  Opzioni della topologia di archiviazione

Tradizionalmente, l'archiviazione viene utilizzata per connettere i server al sistema di archiviazione dati DAS. Oltre a DAS, esistono anche dispositivi di archiviazione NAS che si collegano alla rete, nonché componenti SAN delle reti di archiviazione. I sistemi SAN e NAS sono stati creati in alternativa all'architettura DAS. Inoltre, ciascuna delle soluzioni di cui sopra è stata sviluppata come risposta ai requisiti sempre crescenti per i moderni sistemi di archiviazione dei dati e si basava sull'uso delle tecnologie disponibili in quel momento.

Le architetture dei primi sistemi di archiviazione collegati in rete sono state sviluppate negli anni '90 per ovviare alle carenze più percepite dei sistemi DAS. Le soluzioni di rete nel campo dei sistemi di archiviazione sono state progettate per implementare le attività di cui sopra: ridurre i costi e la complessità della gestione dei dati, ridurre il traffico di rete locale, aumentare le prestazioni complessive e la disponibilità dei dati. Allo stesso tempo, le architetture SAN e NAS risolvono diversi aspetti di un problema comune. Di conseguenza, sono iniziate a esistere contemporaneamente 2 architetture di rete. Ognuno di essi ha le sue funzionalità e i suoi vantaggi.

  DAS


(Dtamp lattached Sessa in riserva) - Questa è una soluzione architettonica utilizzata nei casi in cui il dispositivo utilizzato per archiviare dati digitali è collegato tramite protocollo SAS attraverso un'interfaccia direttamente al server o alla workstation.


   I principali vantaggi dei sistemi DAS: bassi, rispetto ad altre soluzioni di archiviazione, costi, facilità di implementazione e amministrazione, scambio di dati ad alta velocità tra il server e il sistema di archiviazione.

I vantaggi di cui sopra hanno permesso ai sistemi DAS di diventare estremamente popolari nel segmento delle piccole reti aziendali, dei provider di hosting e dei piccoli uffici. Ma allo stesso tempo, i sistemi DAS hanno i loro svantaggi, ad esempio, non l'utilizzo ottimale delle risorse, a causa del fatto che ogni sistema DAS richiede un server dedicato, inoltre, ciascuno di questi sistemi consente di connettere non più di due server a uno scaffale del disco in un determinato configurazione.

vantaggi:

Costo accessibile. SHD è essenzialmente un cestino per dischi installato all'esterno del server e dotato di dischi rigidi.

Fornire scambi ad alta velocità tra il server e l'array di dischi.


   svantaggi:

Mancanza di affidabilità: in caso di incidente o problemi di rete, il server cessa di essere accessibile a un numero di utenti.

Elevata latenza dovuta al fatto che tutte le richieste vengono elaborate da un server.

Bassa gestibilità: la disponibilità dell'intera capacità su un server riduce la flessibilità della distribuzione dei dati.

Basso utilizzo delle risorse: la quantità richiesta di dati è difficile da prevedere: alcuni dispositivi DAS in un'organizzazione potrebbero presentare un eccesso di capacità, mentre altri potrebbero mancarne, dal momento che la riallocazione della capacità è di solito troppo lunga o impossibile.

  NAS


(NrETE lattached Sessa in riserva)   - Questo è un sistema di disco indipendente integrato, che include un server NAS con un proprio sistema operativo specializzato e un insieme di funzioni utili per gli utenti che forniscono un avvio rapido del sistema, nonché l'accesso a qualsiasi file. Il sistema si collega a una normale rete di computer, consentendo agli utenti di questa rete di risolvere il problema della mancanza di spazio libero su disco.

Il NAS è un archivio che si collega alla rete come un normale dispositivo di rete, fornendo accesso ai file ai dati digitali. Qualsiasi dispositivo NAS è una combinazione di un sistema di archiviazione e il server a cui è collegato questo sistema. La versione più semplice di un dispositivo NAS è un server di rete che fornisce risorse di file.

Il dispositivo NAS è costituito da un'unità principale che esegue l'elaborazione dei dati e collega anche la catena del disco a una singola rete. I NAS forniscono l'uso di sistemi di archiviazione nelle reti Ethernet. La condivisione dei file è organizzata in essi utilizzando il protocollo TCP / IP. Tali dispositivi forniscono la condivisione di file anche per quei client i cui sistemi operano con diversi sistemi operativi. A differenza dell'architettura DAS, nei sistemi NAS, il server non può essere portato offline per aumentare la capacità complessiva; È possibile aggiungere dischi alla struttura NAS semplicemente collegando il dispositivo alla rete.

La tecnologia NAS si sta sviluppando oggi come alternativa ai server universali che svolgono un gran numero di funzioni diverse (e-mail, server fax, applicazioni, stampa, ecc.). I dispositivi NAS, a differenza dei server universali, svolgono una sola funzione: il file server, cercando di farlo il più rapidamente possibile, in modo semplice ed efficiente.

La connessione del NAS alla LAN fornisce l'accesso alle informazioni digitali a un numero illimitato di client eterogenei (ovvero client con sistemi operativi diversi) o ad altri server. Oggi, quasi tutti i dispositivi NAS sono utilizzati in reti Ethernet basate su protocolli TCP / IP. L'accesso ai dispositivi NAS avviene attraverso l'uso di protocolli di accesso speciali. I protocolli di accesso ai file più comuni sono DAFS, NFS, CIFS. All'interno di questi server sono installati sistemi operativi specializzati.

Un dispositivo NAS può apparire come un normale "box" dotato di una porta Ethernet, oltre a una coppia di dischi rigidi, oppure può essere un enorme sistema dotato di numerosi server specializzati, un numero enorme di dischi e porte Ethernet esterne. A volte i dispositivi NAS fanno parte di una rete SAN. In questo caso, non hanno le proprie unità, ma forniscono solo l'accesso ai dati che si trovano sui dispositivi a blocchi. In questo caso, il NAS funge da potente server specializzato e la SAN come dispositivo di archiviazione. In questo caso, una singola topologia DAS è formata da componenti SAN e NAS.

I benefici

Basso costo, disponibilità di risorse per i singoli server, nonché per qualsiasi organizzazione di computer.

Versatilità (un server è in grado di servire client Unix, Novell, MS, Mac).

Facilità di distribuzione e amministrazione.

Facilità di condivisione delle risorse.


   carenze

L'accesso alle informazioni tramite i protocolli del file system di rete è spesso più lento dell'accesso a un'unità locale.

La maggior parte dei server NAS convenienti non è in grado di fornire un metodo di accesso flessibile e ad alta velocità, fornito dai moderni sistemi SAN (a livello di blocco, non a livello di file).

  SAN


(Sessa in riserva larea NrETE)   - Questa soluzione architettonica consente di collegare dispositivi di archiviazione dati esterni (librerie di nastri, array di dischi, unità ottiche, ecc.) Ai server. Con questa connessione, i dispositivi esterni vengono riconosciuti dal sistema operativo come locali. L'uso di una rete SAN consente di ridurre i costi totali di gestione di un sistema di archiviazione dei dati e consente alle organizzazioni moderne di organizzare l'archiviazione affidabile delle proprie informazioni.

La versione più semplice di SAN è storage, server e switch collegati da canali di comunicazione ottica. Oltre ai sistemi di archiviazione su disco, è possibile collegare alla SAN librerie di dischi, streamer (librerie di nastri), dispositivi utilizzati per archiviare informazioni su dischi ottici, ecc.

I benefici

Affidabilità dell'accesso ai dati situati su sistemi esterni.

Indipendenza della topologia SAN dai server e dai sistemi di archiviazione utilizzati.

Sicurezza e affidabilità della memorizzazione centralizzata dei dati.

La convenienza della gestione centralizzata dei dati e dei cambi.

Capacità di trasferire il traffico I / O su una rete separata, fornendo offload LAN.

Bassa latenza e alta velocità.

Flessibilità e scalabilità della struttura logica della SAN.

La dimensione geografica illimitata effettiva della SAN.

La capacità di distribuire rapidamente le risorse tra i server.

La semplicità dello schema di backup è garantita dal fatto che tutti i dati si trovano in un unico posto.

Capacità di creare soluzioni cluster tolleranti ai guasti basate su SAN esistenti senza costi aggiuntivi.

La presenza di servizi e funzionalità aggiuntivi, come replica remota, istantanee, ecc.

SAN ad alta sicurezza /


   L'unico inconveniente di tali soluzioni è il loro costo elevato. In generale, il mercato interno dei sistemi di archiviazione dei dati è in ritardo rispetto al mercato dei paesi occidentali sviluppati, caratterizzato dall'uso diffuso dei sistemi di archiviazione. L'elevato costo e la carenza di canali di comunicazione ad alta velocità sono le ragioni principali che ostacolano lo sviluppo del mercato russo dello stoccaggio.

RAID

Parlando di sistemi di archiviazione dei dati, è necessario considerare una delle principali tecnologie che sono alla base del funzionamento di tali sistemi e sono ampiamente utilizzate nel moderno settore IT. Intendiamo array RAID.

Un array RAID è composto da diversi dischi che sono controllati dal controller e interconnessi attraverso canali di dati ad alta velocità. Da un sistema esterno, tali dischi (dispositivi di archiviazione) vengono percepiti nel loro insieme. Il tipo di array utilizzato influenza direttamente il grado di prestazione e la tolleranza agli errori. Gli array RAID vengono utilizzati per aumentare l'affidabilità dell'archiviazione dei dati, nonché per aumentare la velocità di scrittura / lettura.

Esistono diversi livelli RAID utilizzati durante la creazione di reti di archiviazione. I livelli più comunemente usati sono:

   1. Questo è un array di dischi con prestazioni migliorate, senza tolleranza agli errori, con alternanza.
   Le informazioni sono divise in blocchi di dati separati. Viene registrato contemporaneamente su due o più dischi.

pro:

La quantità di memoria viene sommata.

Un aumento significativo delle prestazioni (il numero di dischi influenza direttamente il tasso di aumento della produttività).


   contro:

L'affidabilità di RAID 0 è inferiore all'affidabilità anche del disco più non affidabile, poiché in caso di guasto di una delle unità, l'intero array diventa inattivo.


   2. - array di mirroring del disco. Questo array è composto da una coppia di dischi che si copiano completamente a vicenda.

pro:

Fornendo, durante la parallelizzazione delle query, una velocità di scrittura accettabile, nonché un aumento della velocità di lettura.

Garantire un'elevata affidabilità: un array di dischi di questo tipo funziona fino a quando almeno 1 disco vi lavora. La probabilità di guasto di 2 dischi contemporaneamente, pari al prodotto delle probabilità di guasto di ciascuno di essi, è molto inferiore alla probabilità di guasto di un disco. Se un'unità si guasta, in pratica è necessario prendere immediatamente le misure, ripristinando nuovamente la ridondanza. Per fare ciò, si consiglia che RAID di qualsiasi livello (tranne zero) utilizzino dischi hot spare.


   contro:

L'unico inconveniente di RAID 1 è che l'utente ottiene un disco rigido al prezzo di due unità.



   3. Questo è un array RAID 0 creato da array RAID 1.

4. RAID 2. Utilizzato per array che utilizzano il codice Hamming.

Le matrici di questo tipo si basano sull'uso del codice Hamming. I dischi sono divisi in 2 gruppi: per i dati, nonché per i codici utilizzati per la correzione degli errori. I dati sui dischi utilizzati per archiviare le informazioni sono distribuiti in modo simile alla distribuzione in RAID 0, ovvero sono divisi in piccoli blocchi in base al numero di dischi. I dischi rimanenti memorizzano tutti i codici di correzione degli errori che aiutano a recuperare le informazioni in caso di guasto di uno dei dischi rigidi. Il metodo Hamming utilizzato nella memoria ECC consente di correggere singoli errori al volo e di rilevare doppi errori.

RAID 3, RAID 4. Si tratta di array di dischi alternati, nonché di un disco di parità dedicato. In RAID 3, i dati di n dischi sono divisi in componenti più piccoli di un settore (in blocchi o byte) e quindi distribuiti tra i dischi n-1. I blocchi di parità sono memorizzati su un disco. Nell'array RAID 2, è stato utilizzato un disco n-1 per questo scopo, tuttavia, la maggior parte delle informazioni sui dischi di controllo è stata utilizzata per correggere gli errori al volo, mentre per la maggior parte degli utenti, quando un disco si rompe, è sufficiente un semplice recupero delle informazioni (per questo, ci sono abbastanza informazioni che sono posizionate su un disco rigido ).

Un array RAID 4 assomiglia a RAID 3, tuttavia, i dati su di esso non sono divisi in byte separati, ma in blocchi. Ciò ha in parte reso possibile risolvere il problema della velocità dei dati insufficientemente elevata, che ha una piccola quantità. Allo stesso tempo, la registrazione viene eseguita troppo lentamente a causa del fatto che durante la registrazione viene generata la parità per il blocco, che viene registrata su un singolo disco.
   RAID 3 si differenzia da RAID 2 per l'impossibilità di correggere errori al volo e per ridurre la ridondanza.

pro:

I fornitori di cloud effettuano anche acquisti attivi di sistemi di archiviazione per le loro esigenze, ad esempio Facebook e Google costruiscono i propri server partendo da componenti già pronti per singoli ordini, ma questi server non vengono presi in considerazione nel rapporto IDC.

Inoltre, IDC prevede che i mercati emergenti supereranno presto i mercati sviluppati in termini di consumo di storage, in quanto sono caratterizzati da tassi di crescita economica più elevati. Ad esempio, la regione dell'Europa centrale e orientale, Africa e Medio Oriente nel 2014 supererà il Giappone in termini di costi di stoccaggio. Entro il 2015, la regione Asia-Pacifico, escluso il Giappone, supererà l'Europa occidentale per volume di consumo dei sistemi di stoccaggio.

La vendita di sistemi di archiviazione dati effettuata dalla nostra società "Navigator" offre a tutti l'opportunità di ottenere una base affidabile e duratura per l'archiviazione dei propri dati multimediali. Un'ampia selezione di array Raid, archivi di rete e altri sistemi rende possibile selezionare singolarmente RAID dal secondo al quarto per ciascun ordine è l'incapacità di eseguire operazioni di scrittura parallele, a causa del fatto che un disco di controllo separato viene utilizzato per memorizzare informazioni di parità digitali. RAID 5 non presenta lo svantaggio di cui sopra. Checksum e blocchi dati vengono registrati automaticamente su tutti i dischi; non esiste una configurazione asimmetrica dei dischi. Per checksum intendiamo il risultato dell'operazione XOR, che consente di sostituire qualsiasi operando con il risultato e, utilizzando l'algoritmo XOR, di conseguenza ottenere l'operando mancante. Per salvare il risultato XOR, è necessario un solo disco (la sua dimensione è identica alla dimensione di qualsiasi disco nel raid).

pro:

La popolarità di RAID5 è dovuta principalmente alla sua convenienza economica. Ulteriori risorse vengono spese per la scrittura su un volume RAID5, che alla fine porta a un calo delle prestazioni, poiché sono necessari calcoli aggiuntivi e operazioni di scrittura. Ma quando si legge (rispetto a un disco rigido separato) si ottiene un certo guadagno, consistente nel fatto che i flussi di dati provenienti da più dischi possono essere elaborati in parallelo.


   contro:

RAID 5 è caratterizzato da prestazioni molto inferiori, soprattutto quando si eseguono operazioni relative alla scrittura in ordine casuale (come la scrittura casuale), in cui le prestazioni diminuiscono del 10-25 percento delle prestazioni di RAID 10 o RAID 0. Questo perché questo processo richiede più operazioni su disco (ogni operazione di scrittura del server sul controller RAID viene sostituita con 3 operazioni: 1 operazione di lettura e 2 operazioni di scrittura). Gli svantaggi di RAID 5 appaiono quando un'unità si guasta: allo stesso tempo, l'intero volume passa in modalità critica, tutte le operazioni di lettura e scrittura sono accompagnate da ulteriori manipolazioni, che portano a un forte calo delle prestazioni. In questo caso, il livello di affidabilità scende al livello di affidabilità di RAID 0 dotato del numero corrispondente di dischi, diventando n volte inferiore all'affidabilità di un singolo disco. Se almeno un disco si guasta prima che l'array venga ripristinato o si verifichi un errore irreversibile su di esso, l'array verrà distrutto e i dati su di esso non potranno essere ripristinati utilizzando metodi convenzionali. Si noti inoltre che il processo di ripristino a causa della ridondanza dei dati RAID, chiamato RAID Reconstruction, dopo un guasto del disco, causerà un intenso carico continuo di lettura da tutti i dischi, che rimarrà per molte ore. Di conseguenza, uno dei dischi rimanenti potrebbe non funzionare. Gli errori di lettura dei dati rilevati in precedenza in errori negli array di dati di mantenimento (quei dati a cui non si accede durante il normale funzionamento dell'array - inattivi e archiviati) possono essere rilevati, il che comporta un aumento del rischio di errore durante il recupero dei dati.



  6. - Questo è un array RAID 50 creato da array RAID5;

7. - un array di dischi alternati che utilizza 2 checksum calcolati in 2 modi indipendenti.

RAID 6 è per molti versi simile a RAID 5, ma differisce da esso per un maggiore grado di affidabilità: in esso, la capacità di due dischi viene allocata per i checksum, due importi vengono calcolati utilizzando algoritmi diversi. È richiesto un controller RAID di potenza superiore. Aiuta a proteggere da più guasti, garantendo l'operatività dopo che due unità si guastano contemporaneamente. L'organizzazione di array richiede un minimo di quattro dischi. L'uso di RAID-6 comporta in genere un calo delle prestazioni del gruppo di dischi di circa il 10-15 percento. Ciò è spiegato dalla grande quantità di informazioni che il controller deve elaborare (diventa necessario calcolare il secondo checksum, nonché leggere e scrivere più blocchi del disco durante la registrazione di ciascun blocco).

8. è un array RAID 0 creato da array RAID6.

9. RAID ibrido. Questo è un altro livello dell'array RAID, che recentemente è diventato piuttosto popolare. Questi sono i soliti livelli RAID utilizzati insieme a software aggiuntivo, nonché SSD, che vengono utilizzati come cache di lettura. Ciò porta ad un aumento delle prestazioni del sistema, a causa del fatto che gli SSD, rispetto agli HDD, hanno caratteristiche di velocità molto migliori. Oggi esistono diverse implementazioni, ad esempio Crucial Adrenaline, oltre a diversi controller Adaptec economici. RAID ibrido attualmente non è raccomandato a causa di risorse SSD ridotte.


   Le operazioni di lettura in RAID ibrido vengono eseguite da un'unità a stato solido più veloce e le operazioni di scrittura vengono eseguite sia su unità a stato solido che su unità disco rigido (per eseguire i backup).
   Il RAID ibrido è ideale per le applicazioni che utilizzano dati di livello inferiore (computer virtuale, file server o gateway Internet).

Caratteristiche del moderno mercato dello stoccaggio

Nell'estate del 2013, la società di analisi IDC ha pubblicato la sua prossima previsione per il mercato dello storage, calcolata da essa fino al 2017. I calcoli degli analisti mostrano che nei prossimi quattro anni, le aziende globali acquisteranno sistemi di storage con una capacità totale di centotrentotto exabyte. La capacità totale realizzata dei sistemi di archiviazione aumenterà di circa il trenta percento all'anno.

Tuttavia, rispetto agli anni precedenti, quando si è verificato un rapido aumento del consumo del data warehouse, il tasso di crescita rallenterà leggermente, poiché oggi la maggior parte delle aziende utilizza soluzioni cloud, preferendo tecnologie che ottimizzano i data warehouse. Il risparmio di spazio di archiviazione viene ottenuto utilizzando strumenti come virtualizzazione, compressione dei dati, deduplicazione dei dati, ecc. Tutti gli strumenti di cui sopra consentono di risparmiare spazio consentendo alle aziende di evitare acquisti spontanei e ricorrere all'acquisizione di nuovi sistemi di archiviazione solo quando sono realmente necessari.

Dei 138 exabyte che dovrebbero essere venduti nel 2017, 102 exabyte saranno in sistemi di archiviazione esterni e 36 interni. Nel 2012, lo storage è stato implementato per venti exabyte per sistemi esterni e otto per quelli interni. I costi finanziari dei sistemi di stoccaggio industriali aumenteranno annualmente di circa il 4,1 per cento e entro il 2017 ammonteranno a circa quarantadue miliardi e mezzo di dollari.

Abbiamo già notato che il mercato mondiale dello stoccaggio, che recentemente ha registrato un vero boom, sta gradualmente diminuendo. Nel 2005, la crescita dei consumi di stoccaggio è stata del sessantacinque percento a livello industriale e nel 2006 e 2007, il cinquantanove percento ciascuno. Negli anni successivi, la crescita dei consumi di stoccaggio è diminuita ancora di più a causa dell'impatto negativo della crisi economica globale.

Gli analisti prevedono che un maggiore utilizzo dell'archiviazione cloud ridurrà il consumo di soluzioni di archiviazione a livello aziendale. I fornitori di cloud effettuano anche acquisti attivi di sistemi di archiviazione per le loro esigenze, ad esempio Facebook e Google costruiscono i propri server partendo da componenti già pronti per singoli ordini, ma questi server non vengono presi in considerazione nel rapporto IDC.

Inoltre, IDC prevede che i mercati emergenti supereranno presto i mercati sviluppati in termini di consumo di storage, in quanto sono caratterizzati da tassi di crescita economica più elevati. Ad esempio, la regione dell'Europa centrale e orientale, Africa e Medio Oriente nel 2014 supererà il Giappone in termini di costi di stoccaggio. Entro il 2015, la regione Asia-Pacifico, escluso il Giappone, supererà l'Europa occidentale per volume di consumo dei sistemi di stoccaggio.

Vendita rapida di sistemi di archiviazione

La vendita di sistemi di archiviazione dati effettuata dalla nostra società "Navigator" offre a tutti l'opportunità di ottenere una base affidabile e duratura per l'archiviazione dei propri dati multimediali. Un'ampia selezione di array Raid, archivi di rete e altri sistemi consente di selezionare individualmente per ogni cliente il complesso che gli si addice meglio.

Le ampie capacità tecniche, l'alfabetizzazione e l'esperienza del personale dell'azienda garantiscono un'implementazione rapida e completa dell'attività. Allo stesso tempo, non ci limitiamo esclusivamente alla vendita di sistemi di archiviazione dei dati, poiché eseguiamo anche la sua configurazione, il lancio e il successivo servizio e manutenzione.

LA CAMPANA

C'è chi legge queste notizie prima di te.
Iscriviti per ricevere articoli freschi.
E-mail
Nome
cognome
Come vuoi leggere The Bell
No spam