×

Veri Merkezi Kapasite Bileşenleri için Dayanım Stratejileri


Veri Merkezi Kapasite Bileşenleri için Dayanım Stratejileri
Bölüm-1 


Celal Ünalp 

 
Pandemi sırasındaki deneyimlerle ulusal, küresel ve kurumsal organizasyonlar, sayısal ekosistemlerini keşfetmek, teknolojik güçlerini açığa çıkartarak yeni yeteneklerini bulmak ve potansiyellerini eksiksiz biçimde tamamlamak için yeni normale yatırımlar yapmaktadırlar.

İletişim veri transferi ve bilgi işleme altyapılarında bilgi teknolojileri her zamankinden daha yoğun kullanılmakta, sayısallaşmayla hizmetlerin birçok kritik alanlarında ve fonksiyonlarında elektronik bilgi sistemleri ve iletişim teknolojileri asli rol almaktadır.

Bilgi teknolojileri kullanımının doğal ürünü olarak nitelendirilen elektronik veriler, günlük, haftalık, aylık veya dönemsel çalışmalar sonucunda çeşitli birim ve yerleşkelerde oluşturulabilmekte, yerinde ve uzaktan güncellenebilmekte, taşınabilmekte veya yaşam döngüsünün sonunda arşivlenebilmekte ve silinerek kullanımdan çıkartılabilmektedir.

Sonuç olarak, veri işleme, veri aktarımı ve veri merkezlerine olan gereksinim de çok yüksek hızla artmaktadır.

Elektronik ortamda saklanan verileri silinme/çalınma/bozulmaya karşı korumak ve sürekli erişilebilir olmasını sağlamak için donanım, yazılım, ağ, bilgi, belge, personel ve erişim yedekleme çalışmaları ilgili BT standartları, mevzuat ve ISO Kalite Metodolojileri çerçevesinde yürütülegelmektedir.

Doğal sebeplerle ya da insan eliyle bilgi altyapılarını etkileyerek, kritik süreçleri çalışmaz duruma getirebilen, önemli bilgilere erişimi engelleyen veya bilgilere yetkisiz erişimle sonuçlanan zafiyet durumlarına karşı koyabilen tek kurumsal strateji BT varlıklarını VERİ MERKEZLERİNDE barındırmaktır.


Bu çerçevede veri merkezleri, kurumlara ait bilgi işleme kaynaklarının kontrol altında tutularak kararlı bir ortamda yönetilmesi, verilerin saklanması, işletilmesi ve tek bir noktadan sunulması için oluşturulan gelişmiş teknik altyapı ile donatılan yüksek düzeyli güvenliğin sağlandığı, 7/24 hizmetin sunulacağı, ölçeklenebilir, sürdürülebilir ve yönetilebilir bir ekosistemin ana unsurlarıdır.

Tüm bu strateji ve metodolojilerle veri, erişim ve iletişim güvenliği ve sürekliliği sağlanırken, iş ve veri kaybı en aza indirebileceği gibi, işin veya verinin korunması veya eski duruma dönülmesi aşamasında zaman ve maliyet tasarrufuna da imkân sağlanmaktadır.

Veri Merkezi Kapasite Planlaması

Veri merkezleri, elektro-mekanik ve bina sistemlerinin başarılı ve tümleşik operasyonuna bağımlı olarak her alt sistemin, ayırt edici mühendislik gereksinimlerini karşılamak için tesisle aynı kesintisiz çalışma süresi hedefi ile tutarlı olarak tasarlanır, kurulur, genişletilir ve işletilirler.

Veri merkezi kapasitesi, doğrudan barındırılacak BT varlıklarının kaynak talepleriyle belirlenmektedir. Enerjilendirme ve iklimlendirme için kullanılan aktif bileşenler, kritik BT yüklerini karşılamak için kendi ölçü birimleriyle ve gerekli ayrıntılılık düzeyinde planlamaya dahil edilirler.

Kavramsal tasarımda bileşen kapasitesi bağlamına uygun ölçümle N harfiyle ifade edilir. (NEED / Non-Redundant)

Örneğin, 100 litre su tüketilmesi beklenen bir ofiste N = 100 alınabilecekken, 20 litrelik damacana ile tedarik tercih ediliyorsa N = 5 olarak kavramsal tasarıma aktarılacaktır. Benzer şekilde güvenli sürüş deneyimi için bir arabanın 4 lastiğe ihtiyacı olduğu bilindiğinden N = 4 olarak tarif edilecektir.

Veri Merkezi Yedeklilik Planlaması

En başarılı veri merkezi projeleri, tesis altyapısı yatırımını, kullanılabilirlik veya seçilen görev zorunluluklarına yönelik kuruluş istekleri ile uyumlu hale getirmiş olanlardır. Bu tasarımlarda, bir kesintinin maliyeti, çoğu zaman fiili Amerikan Doları üzerinden, pazar payı üzerindeki etkisi ve devam eden görev zorunlulukları çok iyi bilinir. Kesintilerin gerçek ve kümülatif maliyeti, yüksek kullanılabilirliğe sahip altyapı yatırımını açık bir iş kararı haline getirmektedir.

Uluslararası standartlara uygun olarak risk analizlerini, iş etki analizlerini yaparak bilgi güvenliği kapsam ve olanaklarını değerlendiren, operasyonel bir iş sürekliliği ve ne olursa olsun kesintisiz çalışabilme planına sahip olan organizasyonlar, doğal sebeplerle ya da insan eliyle bilgi altyapılarını etkileyen tehditlere karşı her zaman hazırlıklı ve bu yetenekleri haiz olmayanlardan daha dayanıklı olmaktadır.
 

Yararlanılabilirlik / Kullanılabilirlik / Erişilebilirlik (availability): “Bir öğenin, gerekli dış kaynakların sağlandığı varsayılarak, belirli bir zaman aralığında, belirli kısıtlar altında gerekli bir işlevi yerine getirebilecek durumda olma yeteneği” şeklinde tanımlanmaktadır.

Enerjilendirme ve iklimlendirme için kullanılan aktif elektro-mekanik bileşenlerin, materyal seçimi, üretim teknikleri ve kullanım karakteristiklerinin doğal sonucu olarak çok iyi bilinen, ölçülebilen, öngörülebilen arıza periyotları ve hata modellemeleri bulunmaktadır.

Tek Noktadan Kaynaklı Arıza (Single Point of Failure), bir bileşenin arızalanması durumunda tüm sistemin çalışmasını durduracak bir aksamadır. Donanım, yazılım ya da insan kaynaklı olsun, SPOF yüksek erişilebilirlik veya güvenilirlik hedefi olan herhangi bir sistemde istenmeyen bir durumdur.

Görev kritik altyapılarda (mission-critical) iş başarısı sağlamak için tüm kaynak ve sistemler yüksek seviye güvenlik, güvenilirlik ve dayanıklılık gerektirir. Daha az kesinti daha yüksek kârla sonuçlanır ve sürekli bakımı yapılan kapasite bileşenleri, tesisleri verimli tutmak için anahtar bileşenlerdir. Bu nedenle pek çok tasarımcı yedeklilik modülleriyle birleştirilmiş yedekli kapasite bileşenleri konseptlerini uygulamaktadır.

Yedeklilik (Redundancy), arızadan yoksun bir ortamda fazlalık sayılacak olan, işlevsel yeteneklerin emre amade şekilde sunulmasıdır. Böyle bir sistem asli unsurlardan birisinin arıza vermesi durumunda kendiliğinden veya bir müdahale ile devreye girecek olan yedek bileşenlerden oluşabilir. Örneğin, RAID 0 dışındaki tüm RAID (Bağımsız Disklerin Yedekli Dizisi) uygulamaları, veri yedekliliği (data redundancy) özelliğine sahip, arızaya dayanıklı kayıt ortamlarıdır. Benzer şekilde yazılım, sanallaştırma, konteyner ve veri tabanı kümeleme(cluster) sistemleri, tek bir unsurun arızalanması veya bakıma alınması durumunda hizmetlerin kesintisiz sürdürülebilmesi için tercih edilen yaygın yedeklilik uygulamalardır.

Bu yaklaşımda arıza riskini en aza indirmek için, tüm potansiyel arıza kaynakları dikkate alınır ve kapasite bileşenleri, kesintilerin olumsuz etkileyeceği her yerde yedekli olarak yapılandırılır.

Kavramsal tasarımda yedek kapasite bağlamına uygun ölçümle R harfiyle ifade edilir. (Redundant)

Örneğin, 100 litre su tüketilmesi beklenen bir ofiste N = 100 olacaktır, 20 litrelik damacana ile tedarik tercih ediliyorsa N = 5 olarak kavramsal tasarıma aktarılacaktır. Tedarik aksaklıkları ön görülüyorsa, fazladan 1 damacana suyu yedek olarak tutmak tek noktadan kaynaklı riskleri azaltacaktır. Bu yaklaşım toplamda 120 litre suyu hazırda bulunduran bir ofis için N + 1 = 6 damacana şeklinde ifade edilebilir. Benzer şekilde güvenli sürüş deneyimi için bir arabanın 4 lastiğe ihtiyacı olduğu bilindiğinden N = 4 olarak tarif edilecektir. Yolculuk sırasında tek bir lastiğin patlama olasılığı dikkate alınıyorsa yanımıza 1 adet yedek lastik almak tek noktadan kaynaklı riskleri azaltacaktır. Bu yaklaşım 1 adet yedek lastik bulunduran bir araç için N + 1 = 5 lastik şeklinde ifade edilebilir.

Veri Merkezi Kapasite Bileşenleri için Yedeklilik Seviyeleri

N, Yedekleme Olmayan Seviye


Tam olarak operasyon ihtiyacını karşılayacak kadar kapasite bileşeni mevcuttur (N), yedek bileşen bulunmaz. (R=0)

No alt text provided for this image

Tek bir bileşen arızasında kapasite kaybı yaşanır(N-1), topyekün duruş gerçekleşir, hizmetlerde kesinti yaşanır, kapalı kalma süresi (downtime) işlemeye başlar.

Periyodik bakım yapmak için tüm sistemler kapatılmalıdır, topyekün duruş gerçekleşir, hizmetlerde kesinti yaşanır, kapalı kalma süresi (downtime) işlemeye başlar.

Kapasite artırımı, güncelleme ve taşıma yapmak için tüm sistemler kapatılmalıdır, topyekün duruş gerçekleşir, hizmetlerde kesinti yaşanır, kapalı kalma süresi (downtime) işlemeye başlar.

·        İşletme, yönetim ve insan hataları, kesintiye dönüşebilecek çok yüksek riskler barındırır.

·        Normal işletme şartlarında dayanımı en düşük seviyedir.

·        Bakım altındaki işletme şartlarında dayanımı en düşük seviyedir.

·        İlk kuruluş bütçesi (CAPEX) en düşük seviyedir.

·        İşletme bütçesi (OPEX) en düşük seviyedir.

·        Kavramsal tasarım karmaşıklığı en düşük seviyedir.

·        Bileşenlerin işgal ettikleri fiziksel alan en düşük seviyedir.

·        Kapasite artırımı, güncelleme ve taşıma yapmak için ölçeklenebilirliği en düşük seviyedir.

N + 1, Bir Yedekli Seviye

Tam olarak operasyon ihtiyacını karşılayacak kadar kapasite bileşeni mevcuttur (N), 1 yedek bileşen bulunur. (R=1)

No alt text provided for this image

Tek bir bileşen arızasında kapasite kaybı yaşanmaz (N), yedek unsur devreye alınır, topyekün duruş gerçekleşmez, hizmetlerde kesinti yaşanmaz, kapalı kalma süresi (downtime) işlemez.

Periyodik bakım yapmak için sistemler parçalı olarak kapatılmalıdır, topyekün duruş gerçekleşebilir, hizmetlerde kesinti yaşanabilir, kapalı kalma süresi (downtime) işlemeye başlayabilir.

Kapasite artırımı, güncelleme ve taşıma yapmak için sistemler parçalı olarak kapatılmalıdır, topyekün duruş gerçekleşebilir, hizmetlerde kesinti yaşanabilir, kapalı kalma süresi (downtime) işlemeye başlayabilir.

·        İşletme, yönetim ve insan hataları, kesintiye dönüşebilecek yüksek riskler barındırır.

·        Normal işletme şartlarında dayanımı orta seviyedir.

·        Bakım altındaki işletme şartlarında dayanımı orta seviyedir.

·        İlk kuruluş bütçesi (CAPEX) orta seviyedir.

·        İşletme bütçesi (OPEX) orta seviyedir.

·        Kavramsal tasarım karmaşıklığı düşük seviyedir.

·        Bileşenlerin işgal ettikleri fiziksel alan düşük seviyedir.

·        Kapasite artırımı, güncelleme ve taşıma yapmak için ölçeklenebilirliği orta seviyedir.

N + 2, İki Yedekli Seviye

Tam olarak operasyon ihtiyacını karşılayacak kadar kapasite bileşeni mevcuttur (N), 2 yedek bileşen bulunur. (R=2)

No alt text provided for this image

Tek bir bileşen arızasında kapasite kaybı yaşanmaz (N+1), ardışık iki bileşen arızasında kapasite kaybı yaşanmaz (N), yedek unsurlar devreye alınır, topyekün duruş gerçekleşmez, hizmetlerde kesinti yaşanmaz, kapalı kalma süresi (downtime) işlemez.

Periyodik bakım yapmak için sistemler parçalı olarak kapatılmalıdır, topyekün duruş gerçekleşebilir, hizmetlerde kesinti yaşanabilir, kapalı kalma süresi (downtime) işlemeye başlayabilir.

Kapasite artırımı, güncelleme ve taşıma yapmak için sistemler parçalı olarak kapatılmalıdır, topyekün duruş gerçekleşebilir, hizmetlerde kesinti yaşanabilir, kapalı kalma süresi (downtime) işlemeye başlayabilir.

·        İşletme, yönetim ve insan hataları, kesintiye dönüşebilecek riskler barındırır.

·        Normal işletme şartlarında dayanımı üst seviyedir.

·        Bakım altındaki işletme şartlarında dayanımı üst seviyedir.

·        İlk kuruluş bütçesi (CAPEX) üst seviyedir.

·        İşletme bütçesi (OPEX) üst seviyedir.

·        Kavramsal tasarım karmaşıklığı orta seviyedir.

·        Bileşenlerin işgal ettikleri fiziksel alan orta seviyedir.

·        Kapasite artırımı, güncelleme ve taşıma yapmak için ölçeklenebilirliği orta seviyedir.

N + N veya 2N, İki Sistemli Seviye

Tam olarak operasyon ihtiyacını karşılayacak kapasitenin iki katı bileşen mevcuttur (2N), yedek bileşen bulunmaz. (R=0)

Sistem + Sistem yaklaşımıyla, tamamen bağımsız ve aynalanmış bir altyapı sunulmaktadır.

No alt text provided for this image

Tek bir bileşen arızasında kapasite kaybı yaşanmaz (N), topyekün duruş gerçekleşmez, hizmetlerde kesinti yaşanmaz, kapalı kalma süresi (downtime) işlemez. Diğer sistem üzerinden ardışık ikinci bileşen arızasında kapasite kaybı yaşanabilir (N-1).

Periyodik bakım yapmak için sistemleri kapatmaya gerek duyulmaz.

Kapasite artırımı, güncelleme ve taşıma yapmak için sistemleri kapatmaya gerek duyulmaz.

·        İşletme, yönetim ve insan hataları, kesintiye dönüşebilecek riskler barındırır.

·        Normal işletme şartlarında dayanımı çok üst seviyedir.

·        Bakım altındaki işletme şartlarında dayanımı çok üst seviyedir.

·        İlk kuruluş bütçesi (CAPEX) çok üst seviyedir.

·        İşletme bütçesi (OPEX) çok üst seviyedir.

·        Kavramsal tasarım karmaşıklığı üst seviyedir.

·        Bileşenlerin işgal ettikleri fiziksel alan üst seviyedir.

·        Kapasite artırımı, güncelleme ve taşıma yapmak için ölçeklenebilirliği üst seviyedir.

2(N+1), Tam Yedekli Seviye

Tam olarak operasyon ihtiyacını karşılayacak kapasitenin iki katı bileşen mevcuttur (2N), 2 yedek bileşen bulunur. (R=2)

Sistem + Sistem yaklaşımıyla, tamamen bağımsız, aynalanmış ve aynı zamanda yedekli bir altyapı sunulmaktadır.

No alt text provided for this image

Tek bir bileşen arızasında kapasite kaybı yaşanmaz (2N), topyekün duruş gerçekleşmez, hizmetlerde kesinti yaşanmaz, kapalı kalma süresi (downtime) işlemez. Diğer sistem üzerinden ardışık ikinci bileşen arızasında kapasite kaybı yaşanmaz (N).

Periyodik bakım yapmak için sistemleri kapatmaya gerek duyulmaz.

Kapasite artırımı, güncelleme ve taşıma yapmak için sistemleri kapatmaya gerek duyulmaz.

·        İşletme, yönetim ve insan hataları, kesintiye dönüşebilecek riskler barındırır.

·        Normal işletme şartlarında dayanımı en üst seviyedir.

·        Bakım altındaki işletme şartlarında dayanımı en üst seviyedir.

·        İlk kuruluş bütçesi (CAPEX) en üst seviyedir.

·        İşletme bütçesi (OPEX) en üst seviyedir.

·        Kavramsal tasarım karmaşıklığı en üst seviyededir.

·        Bileşenlerin işgal ettikleri fiziksel alan en üst seviyedir.

·        Kapasite artırımı, güncelleme ve taşıma yapmak için ölçeklenebilirliği en üst seviyedir.

Yüksek Dayanımlı Veri Merkezleri

No alt text provided for this image
Veri merkezi kavramsal tasarımı, ihtiyaç tanımlamayla başlar, kapasite planlamayla devam eder ve dayanım hedefleriyle son bulur, ancak veri merkezi altyapısının uzun vadede kullanılabilirliği yalnızca tasarım ile garanti edilemez. İşletme, yönetim ve insan hataları, kesintiye dönüşebilecek riskleri her zaman barındıracaktır.

Görüldüğü gibi, yedeklilik prensiplerini kullanarak tek noktadan kaynaklı hatalara toleranslı (fault-tolerant) tesisler tasarlamak mümkündür. Ancak yüksek dayanımlı BT altyapı kurguları yedeklilik tamamlandığında başlar, coğrafi dağıtıklık, bulut bilişim imkanları, yazılım tanımlı veri merkezleri, ömür yaşam devri, işletme ve bakım rejimleri ile orta ve uzun vadelerde gelişir ve gerçekleşebilir.

Ömür Devri Yönetimi, bir veri merkezinin uzun vadede kesintisiz çalışma süresi hedeflerine erişme gücünü etkileyen, standartlar ötesindeki riskleri ve davranışları tanımlar. Bir veri merkezinin kesintisiz çalışma süresi hem tesis altyapı seviyesinin hem de Entegre Lojistik Destek (sürdürülebilir operasyon performansının) birleşiminin bir sonucudur. Bu yaklaşım, altyapı yatırımlarını en üst düzeye çıkarmaya yardımcı olurken veri merkezlerinin operasyonel bakış açısıyla karşılaştırmasının yapılmasını kolaylaştırır.

Paylaş:
E-BÜLTEN KAYIT
Güncel makalelerimizden haberdar olmak için e-bültene kayıt olun!
Sosyal Medyada Bizi Takip Edin!
E-Bülten Kayıt