Systemy i systemy przechowywania danych. Typy do łączenia systemów pamięci masowej. Przykłady modeli NAS.

Wyślij pytanie według decyzji W dni powszednie są odpowiedzialne
W godzinę

Andrei Tshannikov,[Chroniony e-mail]stronie internetowej

Zgódźmy się….

Celem tego artykułu nie jest szczegółowym badaniem. różne systemy. przechowywanie danych. (Przechowywanie). Nie analizujemy wszelkiego rodzaju interfejsów - oprogramowania i sprzętu - które są używane podczas tworzenia na różne sposoby przechowywanie. Nie uważajmy za " wąskie miejsca»Te lub inne odmiany magazynowania organizacji. Tutaj nie zobaczysz szczegółowego przeglądu protokołów ISCSI i ich wdrożenia w formie FC (kanał światłowodowy), SCSI itp.

Nasze zadanie jest znacznie bardziej skromne - tylko "zgodzić się na terminologię" z naszym potencjalnym nabywcą. Tak więc dwie fizyki przed rozpoczęciem dyskusji na temat każdego problemu dojść do porozumienia, w którym proces lub zjawisko zostaną oznaczone tymi lub innymi słowami. Jest to konieczne, aby zapisać zarówno czas, jak i komórki nerwowe, i przeprowadzić rozmowę bardziej wydajną i do wzajemnej przyjemności.

Przechowywanie lub ... Przechowywanie?

Zacznijmy, jak mówią od początku.

W ramach przechowywania zrozumiemy, że nadal systemy pamięci masowej jako zestaw oprogramowania i sprzętu, które służą do wiarygodności, jak wysoka prędkość i prosta droga Przechowywanie i dostęp do danych dla organizacji różnych poziomów zarówno funkcji finansowych, jak i strukturalnych. Natychmiast chcesz zwrócić uwagę na to, że różne firmy mają różne potrzeby do przechowywania informacji w jednej formie lub różnych możliwościach finansowych dla ich przykładu wykonania. Ale w każdym przypadku chcemy zauważyć, że bez względu na to, ile pieniędzy lub specjalistów lub innych poziomów są do dyspozycji kupującego, nalegamy, aby wszystkie ich potrzeby są układane w naszej definicji SCD - czy jest to regularny zestaw Dysków o dużej objętości lub złożonego wielopoziomowego struktury komputera PARALLLES Cloud Storage). Ta definicja, naszym zdaniem, obejmuje kolejny szeroko stosowany skrót przetłumaczony na angielski - SCD jako sieć pamięci masowej (sieć pamięci) - SAN. San ilustrujemy trochę poniżej, gdy opowiadamy o typowych sposobach do wdrożenia pamięci.

Najbardziej typowym i zrozumiałym sposobem wykonania pamięci masowej jest DAS - Direct Dołączane magazyny - napędy, które są bezpośrednio podłączone do komputera, który zarządza działaniem tych dysków.

Najłatwiejszym przykładem DAS jest zwykłym komputerem z dysk twardy lub dysk DVD (CD) -Driven lub DVD (CD). Przykład jest bardziej skomplikowany (patrz rysunek) - zewnętrzny napęd urządzenia (zewnętrzny hDD., Półka dysku, napęd taśmowy itp.), Która komunikuje się z komputerem bezpośrednio przez protokół i interfejs (SCSI, ESATA, FC itp.). Oferujemy półki dyskowe lub serwery do przechowywania danych (inne urządzenia ACD) jako urządzenia.

Serwer pamięci w tym przypadku oznacza komputer z własnym procesorem, OS i wystarczającą pamięci do przetwarzania dużych tablic danych przechowywanych na wielu dyskach wewnątrz serwera.

Należy zauważyć, że dzięki temu przykładowi wykonania dane bezpośrednio widzi tylko komputer z DAS, wszyscy inni użytkownicy mają dostęp tylko do danych "za zgodą" tego komputera.

Podstawowe konfiguracje pamięci DAS można zobaczyć

Systemy pamięci masowejNAS.

Kolejną wystarczająco prostą implementację stora - NAS (dołączony do sieci pamięci) jest przechowywaniem danych sieci (ponownie ten sam skrót).

Jak staje się jasny, dostęp do danych jest przeprowadzany protokoły sieciowe.Z reguły, poprzez komputerową sieć lokalną znaną nam (choć istnieje teraz dystrybucja i bardziej złożony dostęp do danych przechowywanych na zasobach sieciowych). Najbardziej zrozumiałym i prostym przykładem pamięci masowej Nas jest magazynowaniem domowym i filmami, do których kilka użytkowników sieci domowej mają bezpośredni dostęp do bezpośrednio.

NAS przechowuje dane w postaci systemu plików, a odpowiednio zapewnia dostęp do zasobów za pomocą protokołów plików sieciowych (NFS, SMB, AFP ...).

Prosty przykład implementacji Nas SCD, patrz rys. 2.

Natychmiast, chcemy zauważyć, że NAS jest w zasadzie, każde inteligentne urządzenie, które ma swój własny procesor, pamięć i dość szybkie interfejsy sieciowe do przesyłania danych przez sieć do różnych użytkowników. Ponadto należy zwrócić szczególną uwagę na ściganie podsystem dysku.. Możesz zobaczyć najbardziej typowe konfiguracje urządzeń NAS w

Sieć pamięci masowej jest jednym ze sposobów wdrożenia pamięci jako systemu przechowywania danych - patrz wyżej.

To oprogramowanie jest sprzętem, a także rozwiązaniem architektonicznym do łączenia różne urządzenia Przechowywanie w taki sposób, aby system operacyjny "widzi" te urządzenia jako lokalne. Osiąga się to poprzez podłączenie tych urządzeń do odpowiednich serwerów. Same urządzenia mogą być różne - tablice dyskowe, biblioteki wstążki, tablice napędów optycznych.

Dzięki rozwojowi technologii przechowywania danych różnica między systemami SAN i NAS stała się bardzo warunkowa. Warunkowo, można je odprowadzać metodą przechowywania danych: San - Urządzenia blokowe, system danych Nas - pliki.

Protokoły wdrażania systemu San mogą być różne - kanał światłowodowy, ISCSI, AOE.

Jednym z sposobów architektury do wdrożenia SAN jest prezentowany na FIG. 3.

Typowe przykłady pamięci San można oglądać

Podsumowując, wyrażamy nadzieję, że udało nam się "zgodzić się z terminologią" z tobą i pozostał tylko w celu omówienia opcji tworzenia dla Twojej firmy i wybrać rozwiązania odpowiednie dla Ciebie niezawodność, prostotę i budżet.

W najprostszym przypadku SAN składa się z przechowywania, przełączników i serwerów w połączeniu z optycznymi kanałami komunikacyjnymi. Oprócz bezpośrednio dysku przechowywania w SAN, można podłączyć biblioteki dyskowe, biblioteki taśmowe (Streamerery), urządzenia do przechowywania na płytach optycznych (CD / DVD i inne) itp.

Przykładem infrastruktury wysoce produktowej, w której serwery są objęte jednocześnie do sieci lokalnej (po lewej) i do sieci przechowywania danych (po prawej). Taki schemat zapewnia dostęp do danych dotyczących przechowywania, gdy awaria dowolnego modułu procesora, przełącznika lub ścieżki dostępu.

Korzystanie z San umożliwia dostarczanie:

scentralizowane zarządzanie zasobami serwerami i systemami pamięci masowej;
podłączanie nowych tablic dysków i serwerów bez zatrzymywania działania całego systemu pamięci masowej;
użycie wcześniej zakupionego sprzętu w połączeniu z nowymi urządzeniami pamięci masowej;
operacyjny i niezawodny dostęp do urządzeń do przechowywania danych w dużej odległości od serwerów, * bez znaczącej utraty wydajności;
przyspieszenie procesu kopii zapasowej i odzyskiwania danych - Bura.

Historia

Rozwój technologie sieciowe. Prowadził do pojawienia się dwóch rozwiązań sieciowych do sieci pamięci masowej (SAN) sieci pamięci do wymiany danych na blokach obsługiwanych przez systemy plików klienckich oraz serwerów serwerów w sieciowym pliku pamięci masowej (NAS). Aby odróżnić tradycyjne magazyny z sieci, zaproponowano kolejny Retron - Direct Attached Storage (DAS).

DAS, SAN i NAS pojawiają się na rynku odzwierciedlają ewoluujące łańcuchy łączy między aplikacjami, które używają danych i bajtów na nośniku zawierający te dane. Dnia, po pewnym momencie programy aplikacji odczytuje i napisał bloki, a następnie sterowniki pojawiły się w ramach systemu operacyjnego. W nowoczesnym DAS, SAN i NAS łańcuch składa się z trzech linków: Pierwszym ogniwem jest utworzenie tablic RAID, drugi - przetwarzanie metadanych, które umożliwia interpretowanie danych binarnych w postaci plików i zapisów, a trzeci - Usługi danych do aplikacji. Różnią się one w zależności od tego, gdzie są realizowane te linki. W przypadku pamięci DAS jest to "gołe", zapewnia tylko możliwość przechowywania i dostępu do danych, a wszystko inne odbywa się po stronie serwera, począwszy od interfejsów i sterowników. Wraz z pojawieniem się San, dostarczanie RAID jest przekazywane na bok SCD, wszystko inne pozostaje tak samo jak w przypadku DAS. A NAS wyróżnia się faktem, że oba metadane są przenoszone na SCHD, aby zapewnić dostęp do plików, tutaj klient pozostaje tylko do obsługi usług danych.

Wygląd San został opracowany w 1988 roku, protokół Włókna (FC) został opracowany, aw 1994 r. ANSI zatwierdzony jako standard. Terminowa sieć pamięci masowej datuje się do 1999 roku. Z biegiem czasu FC dała drogę do Ethernet i otrzymał dystrybucję sieci IP-SAN z połączeniem ISCSI.

Idea sieciowej serwera pamięci masowej NAS należy do Brian Randelle z Uniwersytetu Newquastla i wdrożone w samochodach UNIX-Server w 1983 roku. Ten pomysł był tak udany, że został odebrany przez różnorodne firmy, w tym Novell, IBM i Słońce, ale ostatecznie zmienił przywódców NetApp i EMC.

W 1995 roku Garth Gibson opracował zasady NAS i utworzone przechowywanie obiektów (przechowywanie obiektów, OBS). Zaczął się od tego, że podzielił wszystkie operacje dysków na dwie grupy, wszedł częściej, takich jak czytanie i pisanie, do innego bardziej rzadkiego, takie jak operacje z nazwami. Następnie zasugerował inny kontener oprócz bloków i plików, nazwał go obiektem.

OBS charakteryzuje się nowym typem interfejsu, nazywa się obiektem. Usługi danych klientów współdziałają z metadanami nad interfejsami API obiektów (API obiektów). Nie tylko dane są przechowywane w OBS, ale także wspierane przez RAID, metadane należące do obiektów i jest obsługiwane przez interfejs obiektu. DAS, SAN, SAN, NAS, i COExist w czasie, ale każdy z rodzajów dostępu jest większy zgodny z określonym typem danych i aplikacji.

Architektura San.

Sieć topologii

SAN to szybka sieć danych przeznaczona do podłączenia serwerów do urządzeń pamięci masowej. Różnorodność San Topologii (punkt punktowy, pętla z logiką arbitrażową (pętla arbitrażowa) i przełączania) Wymień tradycyjne połączenia magistrali "Urządzenia pamięci masowej" i zapewniają większą elastyczność, wydajność i niezawodność w porównaniu z nimi. Koncepcja SAN opiera się na możliwości podłączenia dowolnego z serwerów z dowolnym urządzeniem do przechowywania danych za pomocą protokołu kanału z włókna. Zasada interakcji węzłów w San z punktami Topologii lub przełączania pokazano na rysunkach. W San z arbitrażową topologią pętli, transmisja danych jest przeprowadzana sekwencyjnie od węzła do węzła. Aby rozpocząć transmisję danych, nadajnik inicjuje arbitraż dla prawa do korzystania z otoczenia transferu danych (stąd i nazwa topologii - pętla arbitrażowa).

Podstawą transportu SAN jest protokołem kanału światłowodowego, który jest używany zarówno urządzeń miedziowych, jak i światłowodowych.

San Components.

San składniki są podzielone na następujące:

Zasoby pamięci;
Urządzenia wdrażające infrastrukturę San;

Adaptery autobusów przyjmujących.

Zasoby przechowywania danych.

Zastrzeżenia obejmują tablice dyskowe, napędy taśmowe i biblioteki z interfejsem kanału światłowodowego. Wiele ich możliwości wdrażania zasobów pamięci masowej jest włączony tylko w San. Tak więc, najwyższej klasy tablice dyskowe mogą replikować dane między sieciami Masiwood w sieciach z włókna światłowodowe, a biblioteki wstążki mogą wdrożyć przesyłanie danych do taśmy bezpośrednio z tablic dysków z włókna kanałów, omijając sieć i serwery (Serverless Backup). EMC, Hitachi, IBM, Compaq (Rodzina robocza pamięci, Rodzina cyfrowa, Digital) stały się największą popularnością na rynku, a Storaagetek, Quantum / ATL, IBM należy wspomnieć od producentów bibliotek taśmowych.

Urządzenia wdrażające infrastrukturę San

Urządzenia, które realizują infrastrukturę San to przełączniki kanałów włóknistych (przełączniki kanałów włókien, przełączniki FC) i routery (routery z włókien-SCSI). Koncentraty są używane do łączenia urządzeń działających w trybie pętli z włókna (FC_AL). Korzystanie z HUB umożliwia podłączenie i odłączenie urządzeń w pętli bez zatrzymywania systemu, ponieważ koncentrator automatycznie zamyka pętlę w przypadku zamykania urządzenia i automatycznie połącza pętlę, jeśli podłączony był nowy urządzenie. Każda zmiana pętli towarzyszy złożony proces inicjalizacji. Proces inicjalizacji jest wieloetapowy, a przed jego końcem wymiana danych w pętli jest niemożliwa.

Wszystkie nowoczesne sany są zbudowane na przełącznikach, pozwalając na wdrożenie pełnoprawnego połączenie internetowe. Przełączniki mogą nie tylko podłączyć urządzenia do kanałów z włókna, ale także rozróżniać urządzenia, dla których tworzone są tak zwane strefy w przełącznikach. Urządzenia umieszczone w różnych strefach nie mogą wymieniać informacji ze sobą. Liczba portów w San można zwiększyć, łącząc się ze sobą. Grupa pokrewnych przełączników nazywa się tkaniną z włókna lub tylko tkaniny. Relacje komunikacyjne nazywane są linki przeciwdziałające lub skrócone ISL.

Oprogramowanie

Oprogramowanie umożliwia realizację rezerwacji ścieżek dostępu do serwera do tablic dyski i dynamiczny rozkład obciążenia między ścieżkami. W przypadku większości tablic dysków istnieje prosty sposób na określenie, że porty dostępne za pomocą różnych kontrolerów należą do jednego dysku. Specjalistyczne oprogramowanie obsługuje ścieżki dostępu do urządzenia i zapewnia wyłączanie ścieżek w przypadku wypadku, dynamicznego połączenia nowych ścieżek i rozkładu obciążenia między nimi. Z reguły producenci tablicy dyskowej oferują specjalistyczne oprogramowanie tego typu dla swoich tablic. Oprogramowanie VERITAS produkuje oprogramowanie Veritas Volume Manager, zaprojektowane, aby zorganizować woluminy dysku logicznych z dysków fizycznych i zapewnia redundancję ścieżek dostępu do dysków, a także rozkład obciążenia między nimi dla większości znanych tablic dysków.

Używane protokoły

Protokoły niskiego poziomu są używane w sieciach pamięci masowej:

Protokół Fibre Channel Protocol (FCP), transport SCSI przez kanał światłowodowy. Najczęściej używany protokół jest obecnie. Istnieje opcje 1 Gbit / s, 2 Gbit / s, 4 Gbit / s, 8 Gbit / s i 10 Gbit / s.
iSCSI, SCSI Transport przez TCP / IP.
FCOE, FCP / SCSI transport nad "czystym" Ethernet.
FCIP i IFCP, enkapsulacja i transmisja FCP / SCSI w pakietach IP.
HypersCsi, transport SCSI przez Ethernet.
Transport FICON przez kanał światłowodowy (używany tylko przez komputery mainframe).
ATA Over Ethernet, ATA Transport przez Ethernet.
Transport SCSI i / lub TCP / IP przez Infiniband (IB).

Korzyści

Wysoka niezawodność dostępu do danych w systemach pamięci masowej zewnętrznego. Niezależność topologii San z używanych pamięci masowej i serwerów.
Scentralizowane przechowywanie danych (niezawodność, bezpieczeństwo).
Wygodne scentralizowane przełączanie i zarządzanie danymi.
Przesyłanie intensywnego ruchu we / wy do oddzielnej sieci - rozładunku sieci LAN.
Duża prędkość i niskie opóźnienia.
Skalowalność i elastyczność struktury logicznej San
Rozmiary geograficzne San, w przeciwieństwie do klasycznego DAS, są praktycznie nie ograniczone.
Możliwość szybkiego przydzielenia zasobów między serwerami.
Możliwość budowania rozwiązań klastrów tolerancyjnych bez dodatkowych kosztów opartych na dostępnym San.
Prosty schemat kopia rezerwowa - Wszystkie dane są w jednym miejscu.
Dostępność dodatkowe funkcje oraz usługi (migawki, zdalna replikacja).
High Security San.

Udostępnianie systemów pamięci masowej z reguły upraszcza administrację upraszcza i dodaje szybką elastyczność, ponieważ kable i tablice dyskowe nie muszą być fizycznie transportowane i zrekonstruowane z jednego serwera do drugiego.

Kolejną zaletą jest możliwość pobierania serwera bezpośrednio z sieci pamięci masowej. Dzięki tej konfiguracji można szybko i łatwo wymienić awarię

Jeśli serwery są uniwersalnymi urządzeniami, które występują w większości przypadków
- funkcja serwera aplikacji (gdy specjalne programy są wykonywane na serwerze, a następnie intensywne obliczenia),
- Funkcja pliku funkcji (I.e., określone miejsce do scentralizowanego przechowywania plików danych)

Że SCD (systemy przechowywania danych) - urządzenia zaprojektowane specjalnie do wykonywania takich funkcji serwera jako przechowywanie danych.

Potrzeba zakupu pamięci
Zwykle występuje w wystarczających dojrzałych przedsiębiorstwach, tj. ci, którzy myślą o tym, jak
- przechowywać i zarządzać informacjami, najcenniejszym atutem firmy
- zapewnić ciągłość biznesową i ochronę przed utratą danych
- Zwiększ zdolność adaptacyjną infrastruktury IT

Przechowywanie i wirtualizacja
Siły konkurencji MSA skutecznie pracuje, bez przestojów i wysokiej wydajności. Zmiana modeli produkcyjnych, plany taryfoweRodzaje usług występują coraz więcej. Cała brydaza nowoczesnych firm jest "związana" na technologii informacyjnej. Potrzeby działalności szybko się zmieniają i natychmiast odzwierciedlone - rozwijają wymagania dotyczące niezawodności i adaptacji infrastruktury IT. Wirtualizacja zapewnia takie możliwości, ale wymaga to niedrogich i łatwych do utrzymania systemów pamięci masowej.

Klasyfikacja SCD w typie połączenia

Das.. Pierwsze tablice dyskowe były podłączone do serwerów za pomocą interfejsu SCSI. W takim przypadku jeden serwer mógłby pracować tylko z jedną tablicą dysku. Jest to bezpośrednia jednostka pamięci masowej (DAS - Direct Attached Storage).

NAS.. Aby uzyskać bardziej elastyczną organizację struktury centrum obliczeniowego - aby każdy użytkownik mógł użyć dowolnego systemu pamięci masowej - musisz podłączyć pamięć do sieci lokalnej. To jest Nas - Network Dołączona pamięć masowa). Jednak wymiana danych między serwerem a systemem pamięci masowej jest wiele razy bardziej intensywny niż między klientem a serwerem, dlatego w tym przykładzie wykonania pojawiły się obiektywne trudności związane z przepustowością sieci Ethernet. Tak, a z punktu widzenia bezpieczeństwa, nie wykazuje się całkowicie, aby pokazać pamięć do sieci ogólnej.

San. Ale możesz utworzyć własną, oddzielną, szybką sieć między serwerami i przechowywaniem. Ta sieć została zwana SAN (sieć pamięci). Prędkość zapewnia fakt, że Środowisko fizyczne Tłumaczenia Jest optyka. Specjalne adaptery (HBA) i optyczne przełączniki FC zapewniają transmisję danych z prędkością 4 i 8GBIT / s. Wiarygodność takiej sieci wzrosła przez rezerwację (powielanie) kanałów (adaptery, przełączniki). Główną wadą jest wysoka cena.

iscsi.. Wraz z pojawieniem się tanich technologii Ethernet 1GBIT / S i 10GBIT / S, optyka z szybkością transferu 4GBIT / s nie jest tak atrakcyjna, zwłaszcza w odniesieniu do ceny. Dlatego interfejs systemu komputerowego ISCSI jest coraz częściej używany jako środowisko SAN. Sieć ISCSI SAN może być zbudowana na wszelkich starszych podstawach fizycznych, która obsługuje protokół IP.

Klasyfikacja systemów pamięci masowej dla obszaru aplikacji:

Klasa	opis
Osobisty	Najczęściej są zwykły dysk twardy 3,5 "lub 2,5" lub 1,8 "umieszczony w specjalnym przypadku i wyposażony w interfejsy USB i / lub FireWire 1394 i / lub Ethernet i / lub ESATA. Więc mamy urządzenie przenośnektóry można podłączyć do komputera / serwera i wykonać funkcje napędu zewnętrznego. Czasami dla wygody w urządzeniu Dodaj dostęp do bezprzewodowego dostępu, drukarki i portów USB.
Mała grupa robocza.	Jest to zazwyczaj stacjonarne lub przenośne urządzenie, w którym kilka (najczęściej od 2 do 5) twarde dyski SATA, z możliwością wymiany gorącej lub bez interfejsu Ethernet. Tarcze można zorganizować w tablicach - RAID o różnych poziomach, aby osiągnąć wysoką niezawodność pamięci i prędkości dostępu. SCD ma wyspecjalizowany system oparty na systemie oparte na Linuksie i pozwala odróżnić poziom dostępu na nazwie i hasła, zorganizować ofertę miejsca na dysku itp. Takie magazyny nadają się do małych grup roboczych jako zastępując serwery plików.
grupa robocza.	Urządzenie, zwykle zamontowane w stojaku 19 "(stojaków), w którym można zainstalować 12-24 SATA lub SAS twarde dyski z możliwością Hotswap Hot Swap. Ma zewnętrzny interfejs Ethernet i / lub ISCSI. Tarcze są zorganizowane W macierzach - RAID, aby osiągnąć wysoką niezawodność przechowywania i szybkości dostępu. SCD ma specjalistyczne oprogramowanieCo pozwala odróżnić poziom dostępu, organizować kwotę miejsca na dysku, organizować kopię zapasową (kopię zapasową informacji) itp. Takie magazyny nadają się do średnich i dużych przedsiębiorstw oraz są używane w połączeniu z jednym lub większą liczbą serwerów.
Przedsiębiorstwo	Urządzenie stacjonarne lub urządzenie zamontowane w 19 "stojaku (stojak), do którego można zainstalować do setek dysków twardych. Oprócz poprzedniej klasy Ched, może być w stanie zbudować, aktualizację i wymianę komponentu bez zatrzymywania systemu, systemów monitorowania. Oprogramowanie może obsługiwać utworzenie "migawek" i innych funkcji "zaawansowanych". Takie magazyny nadają się do dużych przedsiębiorstw i zapewniają zwiększoną niezawodność, szybkość i ochronę danych krytycznych.
wysokie przedsiębiorstwo	Oprócz poprzedniej klasy przechowywania, tysiące dysków twardych może obsługiwać. Takie Stads zajmują kilka 19 "szafek, całkowitą masę osiąga kilka ton. SDS są przeznaczone do nieprzestania pracy z najwyższym stopniem niezawodności, przechowywania strategicznie ważnych poziomów danych / korporacji.

Historia pytania.

Pierwsze serwery połączone w jednym przypadku wszystkie funkcje (jako komputery) - i obliczanie (serwer aplikacji) i przechowywanie danych (serwer plików). Ale jako potrzeba zastosowań w możliwościach obliczeniowych, z jednej strony, a liczba przetwarzanych danych z drugiej, stała się po prostu niewygodna, aby umieścić wszystko w jednym przypadku. Wydaje się bardziej skuteczniej, aby przeprowadzić tablice dyskowe w oddzielnych budynkach. Ale wtedy kwestia podłączenia tablicy dyskowej z serwerem. Pierwsze tablice dyskowe były podłączone do serwerów za pomocą interfejsu SCSI. Ale w tym przypadku jeden serwer mógł pracować tylko z jednym macierem. Ludzie chcą bardziej elastycznej organizacji struktury centrum obliczeniowego - aby każdy serwer mógł użyć dowolnego systemu pamięci masowej. Podłącz wszystkie urządzenia bezpośrednio do sieci lokalnej i organizować wymianę danych przez Ethernet - oczywiście proste i uniwersalne rozwiązanie. Ale wymiana danych między serwerami i przechowywaniem jest wiele razy bardziej intensywna niż między klientami i serwerami, więc w tej opcji (NAS - patrz poniżej) Istnieją obiektywne trudności związane z przepustowością sieci Ethernet. Wystąpił pomysł stworzenia własnej szybkiej sieci między serwerami i przechowywaniem. Network nazywano San (patrz poniżej). Jest podobny do Ethernet, tylko fizyczna medium transmisji jest tam optyka. Tam też są adaptery (HBA), które są instalowane w serwerach i przełącznikach (optycznych). Standardy prędkości transferu danych według optyki - 4GBIT / s. Wraz z pojawieniem się technologii Ethernet 1GBIT / S i 10GBIT / s, a także protokołu ISCSI, Ethernet nadal korzysta z środowiska SAN.

Zależność procesów biznesowych przedsiębiorstwa z kula IT stale rośnie. Dziś kwestia ciągłości pracy Usług IT zwraca uwagę nie tylko dla dużych firm, ale także przedstawicieli średnich i często małych przedsiębiorstw.

Jednym z centralnych elementów tolerancji błędu jest system pamięci masowej (przechowywanie) - urządzenie, na którym wszystkie informacje są centralnie przechowywane. Przechowywanie charakteryzuje się wysoką skalowalnością, tolerancją błędów, zdolność do wykonywania wszystkich operacji serwisowych bez zatrzymywania działania urządzenia (w tym wymiany komponentów). Ale koszt nawet modelu podstawowego mierzy się w dziesiątkach tysięcy dolarów. Na przykład, Fujitsu Eternus DX100. z 12 dyskami Nearline SAS 1TB SFF (RAID10 6TB) warte porządku 21 000 USD.że dla małej firmy jest bardzo drogie.

W naszym artykule sugerujemy rozważenie opcje organizowania przechowywania budżetuktóry nie przegrywa wydajności i niezawodności klasycznych systemów. Aby go wdrożyć, proponujemy użyć CEPH..

Co to jest Cef i jak to działa?

CEPH. - Repozytorium na podstawie swobodnego oprogramowania jest połączenie przestrzeni dyskowej kilku serwerów (liczba serwerów w praktyce mierzy się dziesiątkami i setkami). CEPH pozwala na stworzenie łatwego repozytorium wysoka wydajność i redundancja zasobów. CEPH może być używany zarówno jako przechowywanie obiektów (podawać do przechowywania plików), jak i jako urządzenie blokujące (powrót wirtualnych dysków twardych).

Tolerancja błędów przechowywania jest dostarczana przez replikację każdego bloku danych na kilka serwerów. Liczba jednocześnie przechowywanych kopii każdego bloku nazywana jest czynnikiem replikacji, domyślnie jego wartość wynosi 2. Schemat działania pamięci masowej jest pokazany na rysunku 1, ponieważ widzimy informacje są podzielone na bloki, z których każda jest dystrybuowana na dwa różne węzły.

Rysunek 1 - Dystrybucja bloków danych

Jeśli serwery nie używają tablic tolerancyjnych tolerancji, zaleca się użycie wyższej wartości współczynnika replikacji dla niezawodnego przechowywania. W przypadku awarii jeden z serwerów CEPH przechwytuje niedostępność bloków danych (rysunek 2), które są opublikowane na nim, oczekuje pewnego czasu (parametr jest skonfigurowany domyślnie, 300 sek.), Po czym zaczyna się Odbudowanie brakujących bloków informacji w innym miejscu (rysunek 3).

Rysunek 2 - Niepowodzenie jednego węzła

Rysunek 3 - Przywrócenie redundancji

Podobnie, w przypadku dodania nowego serwera do klastra, odpychanie jest ponownie zjednoczone, aby jednolicie wypełnić dyski na wszystkich węzłach. Mechanizm, który kontroluje proces dystrybucji bloków informacyjnych w klastrze CEPS, nazywa się Crush.

Aby uzyskać wysoką przestrzeń na dysku na klastrach CEP, zaleca się użycie funkcjonalności warstwowej pamięci podręcznej (buforowanie wielopoziomowe). Jego znaczeniem jest stworzenie oddzielnej puli wysokiej wydajności i używać go do buforowania, główne informacje zostaną umieszczone na tańszych dyskach (Rysunek 4).

Rysunek 4 - Logiczny widok na baseny dyskowe

Buforowanie wielopoziomowe będzie działać w następujący sposób: Żądania klientów do nagrywania będą rejestrowane w najszybszej puli, po czym jest przeniesiony na poziom magazynowania. Podobnie na czytelnikach - informacje podczas kontaktu wzrośnie do poziomu buforowania i przetworzone. Dane nadal pozostają na poziomie pamięci podręcznej, dopóki nie stają się nieaktywne lub, dopóki nie tracą znaczenia (rysunek 5). Warto zauważyć, że buforowanie można skonfigurować tylko do odczytu, w tym przypadku żądania nagrywania zostaną wprowadzone bezpośrednio do puli pamięci.

Rysunek 5 - Zasada pracy pamięci podręcznej

Rozważ prawdziwe scenariusze za pomocą CEPH w organizacji, aby utworzyć hurtownię danych. Jako potencjalny klient organizacje małych i średnich przedsiębiorstw są brane pod uwagę, gdzie ta technologia będzie najbardziej pożądana. Obliczamy 3 scenariusze za pomocą opisanego rozwiązania:

Produkcja lub przedsiębiorstwo handlowe wymagające dostępności wewnętrznego systemu ERP i przechowywania plików 99,98% rocznie, 24/7.
Organizacja, że \u200b\u200bjego zadania biznesowe muszą wdrożyć lokalną chmurę prywatną.
Wysoko decyzja budżetowa Aby zorganizować hurtowni danych blokujących w błąd, w pełni niezależny od sprzętu z dostępnością 99,98% rocznie i niedrogiego skalowania.

Scenariusz użycia 1. Magazyn bazy danych CEPT

Rozważ prawdziwy przykład korzystania z CEPH w organizacji. Na przykład potrzebujemy tolerancyjnego przechowywania wydajności 6 TB, ale koszty nawet na podstawowy model. Dyski magazynowe Makijaż $21 000 .

Zbierz CEPH oparty na magazynie. Oferujemy korzystanie z rozwiązania jako serwerów Supermicro Twin. (Rysunek 6). Produktem to 4 platformy serwerowe w jednej wysokości jednostkowej obudowy 2, wszystkie główne węzły urządzenia są duplikowane, co zapewnia ich ciągłą pracę. Aby wdrożyć nasze zadanie, wystarczy użyć 3 węzłów, 4 będzie w magazynie na przyszłość.

Rysunek 6 - Supermicro Twin

Kompleks każdy z węzłów w następujący sposób: 32 GB pamięci RAM, 4-rdzeniowego procesora 2,5 GHz, 4 SATA 2 TB dla puli pamięci Łączymy w 2 tablicach RAID1, 2 dyski SSD do basenu buforowania również łączą się w RAID1. Koszt całego projektu jest wskazany w tabeli 1.

Tabela 1. Komponenty do CEPH opartych na pamięci

Akcesoria	Cena (USD.	Liczba	Koszt, USD.
	4 999,28	1	4 999,28
	139,28	6	835,68
Bridge Bridge-EP 4-Core 2.5 GHz Procesor (LGA2011, 10MB, 80 W, 22NM) Taca	366,00	3	1 098,00
	416,00	12	4 992,00
	641,00	6	3 846,00
CAŁKOWITY			15 770,96

Wynik: W wyniku budowania repozytorium otrzymujemy tablicę dysku 6 TB z kosztami zamówienia $16 000 , co 25% mniej Jaki jest zakup minimalnego przechowywania, podczas gdy na bieżących kapacie można uruchomić maszyny wirtualne pracujące z repozytorium, oszczędzając w ten sposób na zakupie dodatkowych serwerów. W istocie jest to pełna decyzja.

Serwery, z których zbudowany jest repozytorium, może być używany nie tylko jako pojemnik dysków twardych, ale jako media wirtualne maszyny lub serwery aplikacji.

Scenariusz użytkowania 2. Budowanie prywatnej chmury

Zadaniem jest wdrażanie infrastruktury do budowy chmury prywatnej przy minimalnych kosztach.

Budowanie nawet małej chmury składającej się z przykładu od 3 nośników w przybliżeniu $36 000 : 21 000 $ - koszt przechowywania + 5000 USD za każdy serwer z 50% napełnianiem.

Korzystanie z CEPH jako repozytorium umożliwia połączenie zasobów obliczeniowych i dysków na jednym sprzęcie. Oznacza to, że nie musisz kupować oddzielnie przechowywania - aby umieścić maszyny wirtualne, będą używane płyty zainstalowane bezpośrednio na serwery.

Krótkie odniesienie:
Klasyczna struktura chmurowa jest klastrem maszyn wirtualnych, których funkcjonowanie zapewnia 2 główne składniki sprzętowe:

Computing Part (Compute) - serwery wypełnione RAM i procesory, których zasoby są używane przez maszyny wirtualne do obliczeń
System pamięci masowej (przechowywanie) jest urządzeniem wypełnionym dyskami twardymi, na których przechowywane są wszystkie dane.

Sprzęt przyjmuje te same serwery Supermicro, ale umieścimy mocniejsze procesory - 8 jądrowe o częstotliwości 2,6 GHz, a także 96 GB pamięci RAM w każdym węźlePonieważ system zostanie użyty nie tylko do przechowywania informacji, ale także do pracy maszyn wirtualnych. Zestaw płyt ma podobny pierwszy scenariusz.

Tabela 2. Akcesoria do prywatnej chmury opartej na CEPH

Akcesoria	Cena (USD.	Liczba	Koszt, USD.
Supermicro Twin 2022PR-HTR: 4 systemy wtykowe (węzły) w formie 2U. Dual Socket R (LGA 2011), do 512GB ECC RDIMM, zintegrowany IPMI 2.0 z KVM i dedykowaną LAN. 6x 2,5 "Hot-swap SATA HDD Bays. Redundantne zasilacze 2000W	4 999,28	1	4 999,28
Samsung DDR3 16 GB Moduł pamięci Moduł pamięci ECC 186MHz 1,5 V, podwójna ranga	139,28	18	2 507,04
Intel Xeon E5-2650V2 Ivy Bridge-EP 8-Core 2.6 GHz (LGA2011, 20 MB, 95W, 32NM) Taca	1 416,18	3	4 248,54
Dysk twardy SATA 2TB 2.5 "Pojemność przedsiębiorstwa SATA 6 GB / s 7200 rpm 128MB 512e	416	12	4 992,00
Stan stały napęd SSD. 2.5 "" Seria 400 GB DC S3710.	641	6	3 846,00
CAŁKOWITY			20 592,86

Zebrana chmura będzie miała następujące zasoby, biorąc pod uwagę zachowanie stabilności w niepowodzeniu pierwszego węzła:

RAM: 120 GB
Miejsce na dysku 6000 GB
Kernelki procesora fizyczne: 16 szt.

Zebrany klaster będzie mógł zachować około 10 średnich maszyn wirtualnych z charakterystyką: 12 GB RAM / 4 jądra procesora. / 400 GB miejsca na dysku.

Warto również rozważyć, że wszystkie 3 serwery są wypełnione tylko o 50%, a jeśli to konieczne, można je poddać recyklingowi, zwiększając w ten sposób pulę zasobów dla chmury 2 razy.

Wynik: Jak widać, dostaliśmy zarówno pełny odmowę tolerancyjnej klastra maszyn wirtualnych, jak i redundantnego sklepu danych - awaria dowolnego z serwerów nie jest krytyczna - system będzie nadal funkcjonować bez zatrzymywania się, podczas gdy koszt roztworu wynosi około 1,5 razy niższyniż kupować przechowywanie i oddzielne serwery.

Scenariusz użytkowania 3. Budowanie magazynu danych SuperdeShevy

Jeżeli budżet jest całkowicie ograniczony i nie ma pieniędzy na zakup opisanego powyżej sprzętu, możesz kupić używane serwery, ale nie powinieneś zapisywać na dyskach - zdecydowanie zaleca się kupić nowe.

Proponujemy rozważyć następującą strukturę: zakupione 4 węzły serwerowe, każdy serwer jest ustawiony na 1 dysk SSD do buforowania i 3 disk SATA. Serwery Supermicro z 48 GB pamięci RAM i procesorów 5600 władcy można wykorzystać $800 .

Dyski nie zostaną zebrane w tabliczce tolerancyjnej w ustach na każdym serwerze i zostaną przedstawione jako oddzielne urządzenie. W związku z tym, aby zwiększyć niezawodność repozytorium, użyjemy współczynnika replikacji 3. to znaczy, każdy blok będzie miał 3 kopie. Z taką architekturą lustrzaną dyski SSD. Kesha nie jest wymagana, ponieważ występuje automatyczne powielanie informacji o innych węzłach.

Tabela 3. Komponenty do steregowania

Wynik: Jeśli potrzebujesz tego rozwiązania, możesz użyć większych płyt lub wymień je SAS, jeśli chcesz uzyskać maksymalną wydajność działania DBMS. W ten przykład W rezultacie otrzymujemy przechowywanie 8 tb o bardzo niskim koszcie i bardzo wysokiej tolerancji błędu. Cena jednego terabajty okazała się 3,8 razy tańszeniż podczas korzystania z przechowywania przemysłowego za 21 000 USD.

Końcowy stół, wnioski

Konfiguracja	SKD Fujitsu Eternus DX100 + 12 Nearline SAS 1TB SFF (RAID10)	SKD Fujitsu Eternus DX100 + 12 Nearline SAS 1TB SFF (RAID10) + Supermicro Twin	Nasz skrypt 1: Ceph Database Storage	Nasz skrypt 2: Budowanie prywatnej chmury	Nashseneraal 3: Budowanie długowłosego magazynu
Przydatna objętość, GB	6 000	6 000	6 000	6000	8 000
Cena (USD.	21000	36000	15 770	20 592	7 324
Koszt 1 GB, USD	3,5	6	2,63	3,43	0,92
Liczba IOPS * (Czytanie 70% / Nagrywanie 30%, rozmiar bloku 4K)	760	760	700	700	675
Cel, powód	Przechowywanie	Przechowywanie + obliczanie	Przechowywanie + obliczanie	Przechowywanie + obliczanie	Przechowywanie + obliczanie

* Obliczanie liczby IOP jest wykonane do utworzonych tablic z dysków NL SAS na magazynie SATA, a dyski CEPH na przechowywaniu CEPS, buforowanie zostało odłączone do czystości uzyskanych wartości. Przy użyciu buforowania wskaźniki IOPS będą znacznie wyższe, dopóki nie pamięć podręczna.

W rezultacie możemy powiedzieć, że na podstawie klastra CEPH, można zbudować niezawodne i tanie magazyny danych. Jak pokazano obliczenia, zastosowanie węzłów klastrów tylko do przechowywania nie jest bardzo skuteczny - roztwór jest tańszy niż kupowanie przechowywania, ale niewiele - w naszym przykładzie, koszt przechowywania CEPH wynosił około 25% mniej niż Fujitsu DX100. Naprawdę oszczędności są odczuwane w wyniku połączenia części obliczeniowej i przechowywania na jednym sprzęcie - w tym przypadku wartość roztworu będzie 1,8 razy mniej niż w budowaniu klasycznej struktury za pomocą dedykowanego repozytorium i poszczególnych maszyn hostowych.

EFSOL realizuje tę decyzję w sprawie indywidualnych wymagań. Możemy korzystać z istniejącego sprzętu, który będzie dalej zmniejszyć koszty kapitałowe wdrażania systemu. Skontaktuj się z nami, a my przeprowadzimy badanie urządzenia do użytku podczas tworzenia przechowywania.

Jak wiesz, w ostatnich czasach istnieje intensywny wzrost ilości zgromadzonych informacji i danych. Badanie przeprowadzone przez IDC "Digital Universe" wykazał, że globalna kwota informacji cyfrowych do 2020 r. Jest w stanie zwiększyć z 4,4 Zettheb do 44 czajnika. Według ekspertów co dwa lata objętość informacji cyfrowych jest podwojona. Dlatego dzisiaj jest niezwykle istotne, problem to nie tylko przetwarzanie informacji, ale także jego przechowywanie.

Aby rozwiązać ten problem, obecnie obserwuje się bardzo aktywny rozwój takiego kierunku, co rozwój przechowywania (Sieci / systemy pamięci). Spróbujmy dowiedzieć się, że jest to nowoczesny przemysł IT, który oznacza koncepcję "System przechowywania danych".

Schd to kompleksowe rozwiązanie oprogramowania i sprzętu do organizowania niezawodnego i wysokiej jakości przechowywania różnych zasobów informacyjnych, a także zapewnienie nieprzerwanego dostępu do tych zasobów.

Stworzenie podobnego kompleksu powinno pomóc rozwiązać różnorodne zadania, które tworzą nowoczesny biznes podczas budowy solidnego systemu informacyjnego.

Przechowywanie podstawowych elementów:

Urządzenia pamięci masowej (biblioteka taśmowa, wewnętrzny lub zewnętrzny tablica dysków);

System monitorowania i zarządzania;

Podsystem danych kopii zapasowych / archiwizacji;

Oprogramowanie do zarządzania pamięcią masową;

Infrastruktura dostępu do wszystkich urządzeń pamięci masowej.

Główne cele

Rozważ najbardziej typowe zadania:

Decentralizacja informacji. Niektóre organizacje mają rozwiniętą strukturę oddziałów. Każdy oddzielny podział takiej organizacji musi mieć swobodny dostęp do wszystkich informacji niezbędnych do pracy. Nowoczesne magazyny współdziałają z użytkownikami, którzy są w dużej odległości od centrum, w których przeprowadza się przetwarzanie danych, dlatego jest w stanie rozwiązać to zadanie.

Niemożność przewidywania ostatecznych wymaganych zasobów. Podczas planowania projektu określ, które objętości informacji będą musiały pracować podczas operacji systemu, jest niezwykle trudne. Ponadto masa zgromadzonych danych stale rośnie. Większość nowoczesnych przechowywania jest wspierana przez skalowalność (zdolność do zwiększenia ich wydajności po dodaniu zasobów), więc moc systemu może być zwiększona proporcjonalnie do wzrostu ładunków (produkcja aktualizacji).

Bezpieczeństwo wszystkich zapisanych informacji. Kontrola, a także ograniczenie dostępu do zasoby informacji Przedsiębiorstwa są dość trudne. Niekwestionowane działania próby personelu i użytkowników, celowo zezwolić próby - wszystko to jest w stanie przechowywać znaczącą szkodę. Nowoczesne STDS wykorzystują różne schematy tolerancji błędów, co pozwala wytrzymać zarówno celowy sabotaż, jak i nieudolne działania pracowników niewykwalifikowanych, w ten sposób zachowując wydajność systemu.

Rozproszona złożoność zarządzania przepływy informacyjne. - Wszelkie działania mające na celu zmianę rozproszonych danych informacyjnych w jednej z branży nieuchronnie tworzy wiele problemów - od złożoności synchronizacji różnych baz danych i wersji plików deweloperskich do niepotrzebnego powielania informacji. Produkty zarządzania oprogramowaniem dostarczone z magazynami pomogą Ci optymalnie uprościć i skutecznie optymalizować pracę z zapisanymi informacjami.

Wysokie wydatki. Ponieważ wyniki badań przeprowadzonych przez perspektyw IDC wykazały, koszty przechowywania danych mają około dwudziestu trzy procent wszystkich wydatków. Koszty te obejmują koszty oprogramowania i części sprzętu kompleksu, płatności na personel serwisowy itp. Zastosowanie SCC pozwala zaoszczędzić na podawaniu systemu, a także zapewnia redukcję kosztów personelu.

Główne typy przechowywania.

Wszystkie systemy pamięci masowej są podzielone na 2 typy: Tapeta i przechowywanie dysku. Każdy z dwóch wyżej wymienionych gatunków jest podzielony z kolei dla kilku podgatunków.

Przechowywanie dysku

Takie systemy przechowywania danych są używane do tworzenia kopii zapasowych kopii pośrednich, a także prace operacyjne z różnymi danymi.

Etapy dysku są podzielone na następujące podgatunki:

Urządzenia kopie zapasowe (różne biblioteki dysków);

Urządzenia do danych roboczych (sprzęt charakteryzujący się wysoką wydajnością);

Urządzenia używane do długotrwałego przechowywania archiwów.

Szybka wstążka

Używany do tworzenia archiwów, a także kopii zapasowych.

Zapasy taśmy są podzielone na następujące podgatunki:

Biblioteki taśmowe (dwa lub więcej napędów, duża liczba gniazd dla wstążków);

Autoloaders (1 napęd, kilka gniazd przeznaczonych do wstążków);

Oddzielne dyski.

Podłączeniowe interfejsy

Powyżej przeglądaliśmy główne typy systemów, a teraz radzimy sobie z więcej szczegółami ze strukturą SCD. Nowoczesne systemy pamięci masowej są podzielone w zależności od rodzaju interfejsów łączności hosta. Zastanów się poniżej 2 najczęstszych interfejsów zewnętrznych połączeń - SCSI i Fibrechannel. Interfejs SCSI przypomina szerokie IDE i jest interfejsem równoległym, który umożliwia umieszczenie jednego magistrali z szesnastu urządzeń (dla IDE, jak wiadomo, dwa kanały na kanał). Maksymalna prędkość protokołu SCSI wynosi 320 megabajtów na sekundę (wersja, która zapewni szybkość 640 megabajtów na sekundę, dziś jest w rozwoju). Wady SCSI są następujące - niewygodne, nie posiadanie immunitetu hałasu, zbyt grube kable, których maksymalna długość nie przekracza dwadzieścia pięć metrów. Sam protokół SCSI nakłada również pewne ograniczenia - z reguły, jest to 1 inicjator w oponach plus urządzenia slave (serpentyny, koła itp.).

Interfejs FiBrerechnenchną jest mniej powszechny niż interfejs SCSI, ponieważ sprzęt używany do tego interfejsu jest droższy. Ponadto Fibrechannel służy do wdrażania dużych sieci pamięci masowej danych SAN, więc jest używany tylko w dużych firmach. Odległości mogą być praktycznie dowolne - od standardowych trzysta metrów na typowym sprzęcie do dwóch tysięcy kilometrów dla potężnych przełączników ("Dyrektorzy"). Główną zaletą interfejsu FiBrerechnen jest możliwość łączenia wielu urządzeń pamięci masowej i hostów (serwer) w całkowitej sieci pamięci masowej danych SAN. Mniej ważnych zalet to: większy niż w przypadku SCSI, odległości, zdolność do agregowania kanałów i rezerwacji ścieżek dostępu, możliwość sprzętu "Hot Connection", wyższa odporność na hałas. Stosowane są dwupokojowe pojedyncze i multimodowe kable optyczne (z złączy typu SC lub LC), a także Nadajniki optyczne SFP produkowane na podstawie emitatorów laserowych lub LED (z tych komponentów, maksymalna odległość między używanymi urządzeniami, a także prędkość transmisji ).

Warianty przechowywania topologii

Tradycyjnie przechowywanie służy do łączenia serwerów do DAS - system przechowywania danych. Oprócz DAS, znajdują się również NAS - urządzenia do przechowywania danych, które są podłączone do sieci, a także San - składniki sieci przechowywania danych. San i systemy NAS zostały stworzone jako alternatywę dla architektury DAS. Jednocześnie, każda z wyżej wymienionych rozwiązań została opracowana jako odpowiedź na stale rosnące wymagania dotyczące nowoczesnych systemów pamięci masowej i opierał się na wykorzystaniu technologii dostępnych w tym czasie.

Architektury pierwszych systemów magazynowania sieci zostały opracowane w latach 90., aby wyeliminować najbardziej namawialne wady systemów DAS. Rozwiązania sieciowe w dziedzinie systemów magazynowania miały na celu wdrożenie powyższych zadań: zmniejszenie kosztów i złożoności zarządzania danymi, zmniejszając ruch sieci lokalnych, zwiększając ogólną wydajność i stopień dostępności danych. W tym samym czasie architektury SAN i NAS rozwiązują różne aspekty jednego wspólnego problemu. W rezultacie 2 architektury sieci zaczęły istnieć w tym samym czasie. Każdy z nich ma własną funkcjonalność i zalety.

Das.

(RE.irect. ZA.ttached. S.zezłościć się) - Jest to rozwiązanie architektoniczne używane w przypadkach, w których urządzenie zastosowane do przechowywania danych cyfrowych jest podłączony za pomocą protokołu SAS za pośrednictwem interfejsu bezpośrednio do serwera lub do stacji roboczej.

Główne zalety systemów DAS: Niski, stosunkowo z resztą SCD, koszt, prostota wdrażania, a także podawanie, szybkiej wymiany danych między serwerem a systemem pamięci masowej.

Powyższe korzyści dozwolone systemy DAS stają się niezwykle popularne w małym segmencie sieci korporacyjne., Gospodarza dostawców i małe biura. Jednocześnie systemy DAS mają również swoje wady, na przykład, nie optymalne wykorzystanie zasobów, wyjaśnione przez każdy system DAS, wymagane jest podłączenie serwera dedykowanego, dodatkowo każdy taki system umożliwia nie więcej niż nie więcej niż Dwa serwery do konfiguracji półki dyskowej.

Korzyści:

Dostępny koszt. Przechowywanie jest zasadniczo zainstalowany poza koszem dysku serwera wyposażonego w dyski twarde.

Zapewnienie szybkiej wymiany między serwerem a tablicą dyskowej.

Niedogodności:

Niewystarczająca niezawodność - w przypadku awarii lub wystąpienie jakichkolwiek problemów z serwerem w sieci przestają być dostępne dla wielu użytkowników.

Wysokie opóźnienia wynikające z faktu, że wszystkie żądania są przetwarzane przez jeden serwer.

Niska łatwość zarządzania - dostępność całego kontenera do jednego serwera zmniejsza elastyczność dystrybucji danych.

Niskie wykorzystanie zasobów - wymagane objętości danych są trudne do przewidzenia: Niektóre urządzenia DAS w organizacji mogą doświadczyć nadmiernej zdolności, a inni mogą nie wystarczyć, ponieważ redystrybucja pojemnika jest zwykle zbyt czasochłonna lub niemożliwa.

NAS.

(N.etwork. ZA.ttached. S.zezłościć się) - Jest to zintegrowany oddzielny system dysków, który zawiera serwer NAS z własnym wyspecjalizowanym system operacyjny i zestaw przydatnych funkcji dla użytkowników szybki start Systemy, a także dostęp do dowolnych plików. System jest podłączony do zwykłej sieci komputerowej, umożliwiając użytkownikom tej sieci, aby rozwiązać problem braku wolnego miejsca na dysku.

NAS jest repozytorium, który łączy się z siecią jako normalne urządzenie sieciowe, zapewniając dostęp do plików do danych cyfrowych. Dowolne urządzenie NAS jest kombinacją systemu pamięci masowej i serwera, do którego podłączony jest ten system. Najprostszym wariantowym urządzeniem NAS to serwer sieciowy, który zapewnia zasoby plików.

Istnieją urządzenia NAS z jednostki głównej, która wykonuje przetwarzanie danych, a także łączy łańcuch dysków do jednej sieci. NAS zapewnia korzystanie z systemów pamięci masowej w sieciach Ethernet. Udostępnianie plików są zorganizowane w nich za pomocą protokołu TCP / IP. Takie urządzenia zapewniają udostępnianie plików nawet przez klientów, których systemy działają pod kontrolą różnych systemów operacyjnych. W przeciwieństwie do architektury DAS, w systemach serwerów NAS, aby zwiększyć całkowitą pojemność tryb offline nie można przetłumaczyć; Możesz dodać dyski do struktury NAS, po prostu podłączając urządzenie do sieci.

Technologia NAS rozwija się dziś jako alternatywa dla uniwersalnych serwerów niosących dużą liczbę różnych funkcji (e-mail, serwer faksowy, aplikacje, drukowanie itp.). Urządzenia NAS, w przeciwieństwie do uniwersalnych serwerów, wykonują tylko jedną funkcję - serwer plików, próbując to zrobić tak szybko, jak to możliwe, proste i wydajnie.

Połączenie NAS z LAN zapewnia dostęp do informacji cyfrowych do nieograniczonej liczby heterogenicznych klientów (czyli klienci z różnymi systemami operacyjnymi) lub innymi serwerami. Obecnie prawie wszystkie urządzenia NAS są używane w sieciach Ethernet na podstawie protokołów TCP / IP. Dostęp do urządzeń NAS są przeprowadzane za pomocą specjalnych protokołów dostępu. Najczęstszym protokołem dostępu do plików to DAFS, NFS, CIFS. Wewnątrz takich serwerów są zainstalowane specjalistyczne systemy operacyjne.

Urządzenie NAS może wyglądać jak zwykły "pudełko", wyposażony w jeden port Ethernet, a także parę dysków twardych i może być ogromnym systemem wyposażonym w kilka wyspecjalizowanych serwerów, ogromna ilość dysków, a także zewnętrzna Porty Ethernet. Czasami urządzenia NAS są częścią sieci SAN. W takim przypadku nie mają własnych napędów, ale zapewniają dostęp tylko do tematów znajdujących się na urządzeniach blokowych. W tym przypadku NAS działa jako potężny specjalistyczny serwer i San - jako urządzenie pamięci masowej. Z komponentów San i Nas w tym przypadku utworzone jest pojedyncza topologia DAS.

Korzyści

Niski koszt, dostępność zasobów dla poszczególnych serwerów, a także dla każdego komputera.

Uniwersalność (jeden serwer jest w stanie obsłużyć Klientom Unix, Novell, MS, Mac).

Łatwe wdrażanie, a także administracja.

Łatwe udostępnianie zasobów.

niedogodności

Dostęp do informacji za pośrednictwem protokołów sieciowych systemy plików. Jest często wolniejszy niż dostęp do dysku lokalnego.

Większość serwerów NAS dostępna w cenie nie jest w stanie zapewnić elastycznej metody dostępu szybkiego, który jest wyposażony w nowoczesne systemy SAN (na poziomie bloku, a nie plików).

San

(S.zezłościć się. ZA.rea. N.etwork) - To rozwiązanie architektoniczne umożliwia podłączenie zewnętrznych urządzeń pamięci masowej do serwerów (biblioteki taśmowe, tablice dyskowe, dyski optyczne. itp.). Przy takim połączeniu urządzenia zewnętrzne są rozpoznawane przez system operacyjny jako lokalny. Korzystanie z sieci SAN pozwala zmniejszyć całkowity koszt zawartości systemu pamięci masowej i umożliwia nowoczesne organizacje organizowania niezawodnego przechowywania ich informacji.

Najprostszą wersją SAN jest przechowywanie, serwery i przełączniki w połączeniu z optycznymi kanałami komunikacyjnymi. Oprócz systemów pamięci masowej dysku, SANS można podłączyć do bibliotek dysków, serpentyny (biblioteki taśmowe), urządzenia używane do przechowywania informacji na dyskach optycznych itp.

Korzyści

Wiarygodność dostępu do danych w systemach zewnętrznych.

Niezależność topologii San z używanych serwerów i systemów pamięci masowej.

Bezpieczeństwo i niezawodność scentralizowanego przechowywania danych.

Wygoda scentralizowanych danych i zarządzania komutacją.

Możliwość przenoszenia do oddzielnej sieci I / O, zapewniając rozładunek LAN.

Niska opóźnienie i duża prędkość.

Elastyczność i skalowalność logicznej struktury SAN.

Rzeczywiste nieograniczone rozmiary geograficzne San.

Możliwość szybkiego dystrybucji zasobów między serwerami.

Prostota systemu kopii zapasowej zapewniła fakt, że wszystkie dane znajdują się w jednym miejscu.

Zdolność do tworzenia rozwiązań klastrów tolerancyjnych na podstawie dostępnych San bez dodatkowych kosztów.

Dostępność dodatkowych usług i możliwości, takich jak zdalna replikacja, migawki itp.

Wysokie bezpieczeństwo San /

Jedyną wadą takich rozwiązań jest ich wysoki koszt. Ogólnie rzecz biorąc, krajowy rynek systemów przechowywania danych opóźnia się za rynek rozwiniętych państw zachodnich, który charakteryzuje się powszechnym stosowaniem pamięci. Wysokie koszty i niedobór szybkich kanałów komunikacyjnych są głównymi powodami hamowania rozwoju rosyjskiego rynku magazynowania.

NALOT

Mówiąc o systemach przechowywania danych, jeden i główne technologie leżące u podstaw działalności takich systemów i są stosowane w nowoczesnym branży IT. Mamy na myśli toytach RAID.

Tablica RAID składa się z kilku płyt kontrolowanych przez kontrolera i są związane z danymi za pomocą szybkich kanałów danych. System zewnętrzny, takie płyty (urządzenia pamięci masowej) są postrzegane jako całość. Rodzaj stosowanej tablicy bezpośrednio wpływa na stopień prędkości i tolerancji błędów. Tablice RAID są używane do zwiększenia wiarygodności przechowywania danych, a także zwiększenie prędkości nagrywania / odczytu.

Istnieje kilka poziomów RAID używanych podczas tworzenia sieci przechowywania danych. Najczęściej używane są następujące poziomy:

1. Jest to tablica dysków zwiększonej wydajności, bez przełączania awaryjnego, z alternatywną.
Informacje są podzielone na oddzielne bloki danych. Jest rejestrowany jednocześnie na dwóch lub kilku dyskach.

Plusy:

Podsumuje ilość pamięci.

Znaczny wzrost wydajności (liczba dysków bezpośrednio wpływa na wielokrotność wzrostu wydajności).

Minuses:

Niezawodność RAID 0 jest niższa niż niezawodność nawet najbardziej niewiarygodnego dysku, ponieważ w przypadku awarii dowolnych płyt, cała tablica staje się niezdolność.

2. - Tablica lustrzana dysku. Ta tablica składa się z pary dysków, które całkowicie się kopiują.

Plusy:

Zapewnienie, gdy żądania równoległe w celu dopuszczalnego prędkości rejestracyjnej, a także zwycięskiego wzmocnienia prędkości.

Zapewnienie wysokiej niezawodności - tablicę dysków tego typu funkcji, aż działa w nim co najmniej 1 dysk. Prawdopodobieństwo złamania w tym samym czasie 2 dyskom, równe produktowi prawdopodobieństw awarii każdego z nich, jest znacznie niższy niż prawdopodobieństwo pęknięcia jednego dysku. Podczas łamania jednego dysku w praktyce konieczne jest natychmiastowe podjęcie działań, regeneracji redundancji. Aby to zrobić, zaleca się ona z RAID dowolnym poziomem (z wyjątkiem zero), aby zastosować dyski z rezerwami gorących.

Minuses:

Brak RAID 1 składa się tylko, że użytkownik otrzymuje jeden dysk twardy w cenie dwóch dysków.

3 .. Jest to zbudowany z tablicy RAID 1 RAID 0.

4. RAID 2.. Używane do tablic za pomocą kodu chemowania.

Tablice tego typu opierają się na użyciu kodu chemii. Dyski są podzielone na 2 grupy: dla danych, a także do kodów używanych do skorygowania błędów. Dane na płytach używane do przechowywania informacji są rozprowadzane podobnie do dystrybucji do RAID 0, czyli są one podzielone na małe bloki zgodnie z liczbą dysków. Na pozostałych dyskach wszystkie kody korekcji błędów są przechowywane, które pomagają przywrócić informacje w przypadku awarii jednego z dysku twardego. Metoda hemming używana w pamięci ESS umożliwia skorygowanie jednorazowych błędów w locie, a także wykrywać dwa razy.

RAID 3, RAID 4. Są to tablice dyskowe z alternatywną, a także dedykowaną parytetem dysku. W RAID 3 dane z dysków N są podzielone na składniki wielkości mniej sektora (na blokach lub bajtach), po czym są dystrybuowane na dyskach N-1. Bloki parzystości są przechowywane na jednym dysku. W tablicy RAID 2, dysk N-1 został użyty do tego celu, jednak większość informacji na dyskach sterujących była używana do prawidłowego poprawnego błędów, podczas gdy większość użytkowników była wystarczająca, gdy podział dysku proste wyzdrowienie Informacje (dla tego jest wystarczająco dużo informacji, które są umieszczane na jednym dysku twardym).

Tablica RAID przypomina RAID 3, jednak dane na niej nie są podzielone na oddzielne bajty, ale do bloków. Częściowo dozwolone rozwiązanie problemu nie ma wystarczającej ilości wysokiej szybkości transmisji danych mających małą objętość. Rekord prowadzi się zbyt wolno ze względu na fakt, że rekord jest generowany przez parzystość dla urządzenia, nagrywanie na jednym dysku.
RAID 2 RAID 3 wyróżnia się niezdolnością do regulacji błędów w locie, a także mniej redundancji.

Plusy:

Dostawcy w chmurze przeprowadzają również aktywne zakupy na potrzeby systemów pamięci masowej, na przykład Facebook i Google Build z gotowych komponentów do dostosowywania własnych serwerów, ale serwery te w raporcie IDC nie są brane pod uwagę.

Również IDC spodziewa się, że wkrótce rozwijanie rynków dotyczących zużycia magazynów znacznie wyprzedził rynki opracowane, ponieważ charakteryzują się one wyższymi stopami wzrostu gospodarczego. Na przykład region Europy Wschodniej i Środkowej, Afryki i Bliski Wschód w 2014 r. Przez wydatki na systemy przechowywania danych przekroczą Japonię. Do 2015 r. Region Azji i Pacyfiku, z wyłączeniem Japonii, pod względem wielkości konsumpcji systemów magazynowych przewyższy Europę Zachodnią.

Sprzedaż systemów przechowywania danych wykonywanych przez naszą firmę stanowi okazję, aby każde pragnie uzyskać niezawodną i trwałą podstawę do przechowywania danych multimedialnych. Szeroki wybór macierzy RAID, pamięci masowej i innych systemów umożliwia wybranie czwartego zamówienia RAID dla każdego zamówienia RAID dla każdego zamówienia. RAID 5 nie ma wyżej wymienionej wady. Bloki kontrolne nagrywania i bloków danych są przeprowadzane automatycznie na wszystkich płytach, brakuje asymetrii konfiguracji dysku. W ramach kwot kontroli, o którym mowa w przypadku wyniku działania XOR.xor umożliwia zastąpienie wyniku dowolnego operanda i przy użyciu algorytmu XOR, w wyniku czego uzyskać brakujące operand. Aby utrzymać wynik XOR, potrzebujesz tylko jednego dysku (rozmiar go jest identyczny z wielkością dowolnego dysku RAID).

Plusy:

Popularność RAID5 jest wyjaśniona głównie przez jego gospodarkę. Dodatkowe zasoby są wydawane na rekordzie RAID5, co powoduje spadek wydajności, ponieważ potrzebne są dodatkowe obliczenia, a także operacje rekordowe. Ale podczas czytania (w porównaniu z oddzielnym dysku twardym) istnieje pewna wygrana, polegająca na tym, że przepływy danych działające z wielu dysków można przetwarzać równolegle.

Minuses:

RAID 5 charakteryzuje się znacznie niższą wydajnością, zwłaszcza przy prowadzeniu operacji związanych z arbitralną kolejnością (typ losowy), w którym wydajność zmniejsza się o 10-25 procent RAID 10 lub RAID 0 wydajności. Jest to dlatego, że ten proces jest wymagany. Więcej Operacje z dyskami (istnieje zastępstwo każdej operacji nagrywania serwera na kontrolerze RAID do 3 operacji - 1 operacji odczytu i 2 operacji rekordów). Minuses RAID 5 manifestują się, gdy pojawia się jeden dysk - obserwuje się, gdy obserwuje się przejście całej objętości w trybie krytycznym, wszystkie operacje czytania i rekordowe towarzyszą dodatkowe manipulacje, co prowadzi do ostrego spadku wydajności. Poziom niezawodności jest upuszczony do poziomu niezawodności RAID 0, wyposażonego w odpowiednią liczbę płyt, stając się w czasie nim mniej niż niezawodność pojedynczego dysku. W przypadku, aby przed wejściem do odzyskiwania nie powiedzie się, co najmniej jeden dysk albo lub niezrównoważony błąd pojawi się na niej, tablica zapadnie, a dane na nie można przywrócić konwencjonalnymi metodami. Należy również pamiętać, że proces odzyskiwania przez redundancję danych RAID, który nazywa się rekonstrukcją RAID, po zakończeniu dysku spowoduje intensywny ciągły odczyt od wszystkich dysków, które mają być zapisane przez wiele godzin. W rezultacie jeden z pozostałych dysków może zawieść. Ponadto, nie odkryto wcześniej wcześniej wykrytych odczytów danych tablic danych zimnych (tych danych, do których podczas normalnego działania tablicy nie odwoływać i zarchiwizowane), co prowadzi do wzrostu ryzyka awarii podczas odzyskiwania danych.

6. Jest to tablica RAID 50, która jest zbudowana z tablic RAID5;

7. - tablica dysków z alternatywną, która wykorzystuje 2 sumy kontrolne obliczone przez 2 niezależne metody.

RAID 6 jest w dużej mierze podobny do RAID 5, ale różni się od niego większy stopień niezawodności: w nim pojemność dwóch dysków jest wybrany do sum sterowania, dwie ilości są obliczane na różnych algorytmach. Wystarczamy do kontrolera RAID wyższa moc. Pomaga chronić przed wielokrotną awarią, zapewniając wydajność po awarii dwóch dysków jednocześnie. Organizacja tablicy wymaga użycia minimum czterech dysków. Zastosowanie RAID-6 zwykle prowadzi do spadku wydajności grupy dyskowej około 10-15 procent. Jest to wyjaśnione przez dużą ilość informacji, że kontroler musi przetworzyć (konieczność obliczania drugiego sumu kontrolnego, a także odczyt i nadpisanie większej liczby bloków dysków podczas nagrywania każdego z bloków).

8. Jest to tablica RAID 0, która jest zbudowana z tablic RAID6.

9. Hybrydowy Raid.. To kolejny poziom masyw RAID, który ostatnio stał się dość popularny. Są to zwykłe poziomy RAID używane z dodatkowym oprogramowaniem, a także dyski SSD, które są używane jako pamięć podręczna do odczytu. Prowadzi to do wzrostu wydajności systemu, wyjaśnił fakt, że SSD, w porównaniu z HDD, ma znacznie lepsze właściwości szybkich prędkości. Obecnie istnieje kilka implementacji, na przykład, kluczowa adrenalina, a także kilka kontrolerów budżetowych Adaptec. Obecnie nie zaleca się stosowania hybrydowego RAID z powodu małego zasobu SSD.

Hybrydowe operacje odczytu RAID są wykonywane z napędu stanu stałego o większej prędkości, a operacje rekordów prowadzone są na dyskach stanu stałego i twarde dyski (Odbywa się to w celu spełnienia rezerwacji).
Hybrydowa RAID jest świetna dla aplikacji przy użyciu danych niższego poziomu (maszyna wirtualna komputera, serwer plików lub bramy internetowej).

Cechy nowoczesnego magazynowania na rynku

Firma analityczna IDC Latem 2013 r 2013 r. Ogłosiła kolejną prognozę na rynku SCHD, obliczony przez niego do 2017 r. Obliczenia analityczne wykazują, że w bliskiej części czterostreślenia światowych przedsiębiorstw zostaną zakupione przez magazyn, całkowita pojemność, której będzie stalnie trzydzieści - Egzamin. Kumulatywnie wdrożona moc systemów pamięci masowej wzrośnie o około trzydzieści procent rocznie.

Jednak w porównaniu z poprzednimi latami obserwowano, gdy zaobserwowano szybki wzrost konsumpcji przechowywania danych, tempo tego wzrostu spowalnia nieco, ponieważ dzisiaj większość firm wykorzystuje rozwiązania w chmurze, preferując technologie, które optymalizują huzyki danych. Oszczędności urządzeń przechowywania uzyskuje się przy użyciu środków, takich jak wirtualizacja, kompresja danych, deduplikacja danych itp. Wszystkie powyższe fundusze zapewniają oszczędności przestrzeni, umożliwiając spółki, aby uniknąć spontanicznych zakupów i uciekania się do nabycia nowych systemów pamięci masowej tylko wtedy, gdy naprawdę mieć potrzebę.

Z 138 egzaminu, której sprzedaż oczekuje się w 2017 r., 102 egzamin spadnie na zewnętrzne przechowywanie i 36 - na wewnętrznym. W 2012 r. ACC został wdrożony na dwadzieścia egzaminu dla systemów zewnętrznych i przez ośmiu - dla wewnętrznego. Wydatki finansowe. W przypadku przechowywania przemysłowego wzrosną corocznie o około 4,1 procent, a do 2017 r. Nakłada kolejność czterdzieści dwa i pół miliarda dolarów.

Zauważyliśmy już, że niedawno przeżył prawdziwy znaczek rynkowy belki stopniowo poszedł do spadku. W 2005 r. Wzrost konsumpcji SCC wyniósł na poziomie przemysłowym sześćdziesiąt pięć procent, aw 2006 r., A także 2007 r. - pięćdziesiąt dziewięć procent. W kolejnych latach wzrost konsumpcji dorsza spadł jeszcze bardziej ze względu na negatywny wpływ światowego kryzysu gospodarczego.

Analitycy przewidują, że wzrost wykorzystania przechowywania w chmurze doprowadzi do zmniejszenia zużycia rozwiązań systemów przechowywania danych na poziomie korporacyjnym. Dostawcy w chmurze przeprowadzają również aktywne zakupy na potrzeby systemów pamięci masowej, na przykład Facebook i Google Build z gotowych komponentów do dostosowywania własnych serwerów, ale serwery te w raporcie IDC nie są brane pod uwagę.

Sprzedaż operacyjna systemów pamięci masowej

Szeroka szansa techniczna, umiejętności czytania i pisania i doświadczenia personelu firmy gwarantują szybką i kompleksową realizację zadania. Jednocześnie nie ograniczymy się wyłącznie do sprzedaży systemów przechowywania danych, ponieważ wykonujemy również jego ustawienie, uruchomienie i późniejszą obsługę i konserwację.

Systemy i systemy przechowywania danych. Typy do łączenia systemów pamięci masowej. Przykłady modeli NAS.

Zgódźmy się….

Przechowywanie lub ... Przechowywanie?

Systemy pamięci masowejNAS.

Historia

Architektura San.

Sieć topologii

San Components.

Adaptery autobusów przyjmujących.

Zasoby przechowywania danych.

Urządzenia wdrażające infrastrukturę San

Oprogramowanie

Używane protokoły

Korzyści

Historia pytania.

Co to jest Cef i jak to działa?

Scenariusz użycia 1. Magazyn bazy danych CEPT

Scenariusz użytkowania 2. Budowanie prywatnej chmury

Scenariusz użytkowania 3. Budowanie magazynu danych SuperdeShevy

Końcowy stół, wnioski

Przechowywanie podstawowych elementów:

Główne cele

Główne typy przechowywania.

Podłączeniowe interfejsy

Warianty przechowywania topologii

Das.

NAS.

San

NALOT

Cechy nowoczesnego magazynowania na rynku

Sprzedaż operacyjna systemów pamięci masowej

Przeczytaj także.

Oznaczanie obciążeń rozliczeniowych współczynnika sieci elektrycznej kombinacji maksymalnych obciążeń

Sieci wtórne sieci komunikacyjne sieci wtórne

Instalacja oficjalnego oprogramowania układowego na Samsung Galaxy S6 oprogramowanie firmware Nokia C6 00

Dzwon.