Felaketleri maalesef hayatın bir parçası olarak kabul etmemiz gerekiyor. Felaket denilince aklımıza genelde yangın, sel, fırtına ve deprem gibi doğal afetler gelse de donanım arızaları, siber saldırılar, fidye yazılımı veya iç tehditler de sistemlerimizde felaket seviyesinde kesintiler ve önemli veri kayıpları yaratabilecek potansiyele sahiptir. Diğer yandan günümüzün BT ortamları artık daha büyük ve karmaşık. Dinamik olarak her dakika değişebildiğini her gün deneyimliyoruz. Dolayısıyla BT servisleri için kurtarma süreçlerini de dinamik olarak devamlı yönetmemiz gerekiyor. Bununla beraber, gelişen dünyamızda artık tüm kurumlar hizmet düzeyi süreçlerinde SIFIR kesinti süresi ve SIFIR veri kaybı hedefliyor, bir yandan da uyumluluk ve saklama hedeflerini karşılamak, bu süreçleri kolaylıkla yönetebilmek için bir çözüm arıyor.
Bir felakete karşı önceden hazırlık yapmıyorsanız, hizmet kesintisinden, veri kayıplarına, müşterileriniz karşısında oluşacak prestij kaybından, yasal süreçlere uzanan sorumlulukları şimdiden kabul ediyorsunuz demektir. Bu süreçleri yaşamamak için, olası bir felakete veya veri kaybına karşı hazırlıklarımızı çok öncesinde tamamlamamız, sistemlerimizi ve süreçlerimizi bu çerçeve içinde yönetmemiz ve planlarımızı sıklıkla test etmemiz gerekiyor. Felaket öncesinde yapılan iyi bir planlama felaket anında hizmet kesintilerini veri kayıplarını minimize edecektir.
Felaket kurtarma hepimizin planlamak zorunda olduğu, bir o kadar kolay gözükmesine rağmen bir o kadar da detaylı yapılması gereken, gerçekten zor bir konu olarak karşımıza çıkabiliyor. Aşağıdaki sorulardan bazılarını kendinize sorarsanız, bu süreç içinde hangi adımda olduğunuzu kolaylıkla tespit edebilirsiniz:
- Kritik sistemleri ve kritik verileri barındıran iş yüklerini tanımladınız mı? Bu uygulamaların bağımlılık bilgileri ve haritaları mevcut mu?
- Önceliklere ve teknik isterlere göre tanımlanmış bir felaket kurtarma planı var mı?
- Planınız varsa (hangi aralıklarla) en son ne zaman tüm ölçekte test ettiniz? (Tüm ölçekte test edilmeyen bir planı, felaket anında test edeceğinizi unutmayın!)
Felaket kurtarma (FK) nedir?
İsminden anlaşıldığı üzere, Felaket Kurtarma, bir felaketin ardından hayati altyapı ve sistemlerin kurtarılması ve yeniden faaliyete geçirilme sürecidir. Yukarıdaki sorulardan da anlaşılacağı üzere, Felaket kurtarma süreçlerinin planlaması bir ekip işidir. Bu sürecin en önemli kısımlarından bir tanesi ise doğru bir analiz ile bir felaket planının çıkarılması, daha da önemlisi bu planın test edilerek, raporlanması ve uyumluluk süreçlerine uygun hale getirilmesidir.
FK planını hazırlarken, tüm servislerimizin, iş yüklerinin ve hizmet seviyelerinin (SLA – Service Level Aggrement) belirlenmesi, kritik verilerin ve uygulamaların tanımlanması, uygulama bağımlılık haritalarının çıkarılması, hangi ekiplerin hangi aksiyonları hangi sırayla alacağına kadar değerlendirilmesi gerekiyor. Bu adımlar tanımlanmış olsa bile, düzenli olarak bu adımların testlerinin yapılması gerekiyor ki, tüm sürecimiz istediğimiz gibi sorunsuz olarak ilerleyebilsin ve dinamik olarak değişen ortamımıza ayak uydurabilsin. Felaket anında, kurtardığımız bir iş yükünün neden mavi ekranda kaldığı veya hangi network bloğunda çalışacağı veya servisin çalışması için bağımlılıkları hakkında kim zaman harcamak ister ki!
Özetle; felaket kurtarma kolay bir süreç değildir. Fakat, bir kesintinin doğuracağı kayıp ve maliyet, felaket kurtarma planına sahip olmanın maliyetinden kat kat daha fazla olabiliyor. Sınırlı bütçe, kaynak yetersizliği, önceliklendirmeler, diğer projeler vb. derken FK konusunu genelde hep en son olarak ele alıyoruz. Özellikle pandemi ile hız kazanan fidye yazılımı gibi siber saldırıları da çoklukla duyar ve görür hale geldik ve gün geçtikçe artmaya da devam ediyor. Tüm bu nedenlerle, Felaket Kurtarma planınızı oluşturma, bu planı test etme ve ihtiyaç olduğunda oluşturduğunuz planı tek bir tıkla hayata geçirmek, felaket kurtarma süreçlerinizi kolaylaştırmak ve otomatikleştirmek için felaket kurtarma yazılımına ihtiyaç bulunuyor.
Tam bu noktada, yalnız değilsiniz. Veeam Modern Veri Koruma Platformu ile yedekleme ve kurtarma süreçlerinizi kolaylaştırırken, VMware altyapılarında, sizlere aynı kullanım kolaylığını ve basitliğini sunarken, karmaşıklığı ortadan kaldıran FK orkestrasyon seçeneklerine sahip!
Veeam ile Felaket Kurtarma Yapıtaşları
VMware sanal makinelerinizi kurtarmanın stressiz en kolay yolu…
Veeam Disaster Recovery Orchestrator (kısaca VDRO), Veeam’in lider yedekleme ve replikasyon çözümü olan Veeam Backup & Replication’ının üzerine oturan bir çatı ürün veya güçlü bir eklenti yazılım olarak düşünebilirsiniz. Veeam Disaster Recovery Orchestrator ile Felaket Kurtarma ön hazırlıklarınızı, başınıza bir felaket gelmeden, detaylı bir şekilde planlayabilir, testlerini izole ortamda otomatik olarak yapabilir ve süreçleriniz için tüm adımları raporlayabilirsiniz.
VDRO, Veeam Backup & Replication’ın güçlü yetenekleri ile entegre olabilen, felaket kurtarma (FK) süreçlerinizi otomatikleştiren, kurtarma süreçlerinizi bir üst seviyeye taşıyan, FK planlarının önceden hazırlanabilmesini, otomatik testlerinin basit bir şekilde yapılabilmesini sağlayan, dinamik belgelendirmeler ile raporlamasını sağlayan, RPO ve RTO ihlallerini önlemenize yardımcı olan bir orkestrasyon yazılımı. En önemlisi de bir felaket olduğunda, oluşturulan ve test edilen planları 1-tık ile çalıştırabilir, kurtarma süreçlerinizi, planladığınız gibi, kolay ve hızlı bir şekilde yürütebilirsiniz.
VDRO’nun Veeam Backup and Replication ile beraber çalıştığından bahsetmiştik. Dolayısıyla, orkestrasyonu sağlamak için, yedekleme ve iş sürekliliği süreçlerimizin en iyi uygulamalar kapsamında öncesinde oluşturulması gerekiyor. Oluşturduğumuz bu yedeklemeleri, replikaları (CDP ve normal replikalar dahil olmak üzere) ve entegre olabilen depolama alanlarını kullanarak, VDRO ile FK otomasyonu planlarımızı ihtiyaçlarımız doğrultusunda rahatlıkla tanımlayabiliriz. O zaman FK kapsamında önemli olan yedeklemeleri ve iş sürekliliğini biraz detaylandıralım…
Veeam Backup & Replication
Veeam Backup and Replication (VBR) hem şirket içi hem de buluttaki tüm iş yükleriniz için lider yedekleme, kurtarma ve veri güvenliği çözümüdür. Modern Veri Koruması Platformunun temelini oluşturan VBR, sizlere basit, esnek, güvenilir ve güçlü bir veri koruma sunmaktadır. Güçlü ve sektörün öncü veri koruması teknolojilerinin yansıra, anında kurtarma teknolojileri ile de kesinti sürelerini ortadan kaldırırken, sabit yedeklemeler, Lab ortamında otomatik doğrulanabilir yedeklemeler ve daha fazlası ile siber tehditlere karşı bizleri koruma altına almaktadır. Tüm bunları da tamamen yazılım tanımlı, donanımdan bağımsız tek bir çözüm olarak sunmaktadır.
3-2-1-1-0 Kuralı
Felaket kurtarma için temel yapıtaşımız yedeklemelerimiz ve replikalarımız demiştik. Veri koruması için temel kurallardan biri olan 3-2-1-[1-0] kuralını bizlerden devamlı duyarsınız. Veeam mimarisi de tamamen bu kural üzerine inşa edilmiştir. Bu altın kural gerçekten değerli ve burada bir kez daha değinilmeyi gerçekten hak ediyor:
3-2-1: Bir verinizin, mutlaka 3 farklı kopyasının en az 2 farklı medyada bulunması, 1 tanesinin de mutlaka site dışı (off-site) olması önerilmektedir.
Daha basit anlamda örneklersek; bir iş yüküm varsa (sanal veya fiziksel: 1. Kopya) mutlaka yedeğini alıp farklı bir depolama alanına (2. Kopya) yazmamız gerekiyor. Üretim ortamı ile aynı depolama cihazı kullanıldığında, eğer depolama cihazında veya alanında bir bozulma olursa, iş yükleri ile beraber yedeklerinizi de kaybetme olasılığı çok yüksek. Özetle, bu kural tüm yumurtaların aynı kesede olmamasını önermektedir!
Veri merkezi çapında bir felaket olması durumunda da site dışı (off-site) olarak tuttuğumuz (3. Kopya) yedeklemelerden istediğimiz farklı bir ortama rahatlıkla kurtarma sağlayabiliriz. Anlık kurtarma teknolojileri ile VMware, HyperV ve AHV ortamlarına dakikalar içinde kurtarma yapabilirsiniz. Bir FK veri merkezinin bulunmadığı ortamlarda ise, bu yedeklemeleri kullanarak genel bulut ortamlarına (AWS, Azure, GCP) kurtarma yapmak da sizlere ayrı bir alternatif ve esneklik sunmaktadır.
Gelelim [1-0]’a: Aldığımız yedeklerin en az [1] tanesi mutlaka ya hava boşluklu bir ortamda (örnek olarak teyp verebiliriz, teypleri farklı bir lokasyonda, kasa’da muhafaza edebilirsiniz) veya yedeklerin en az [1] tanesinin “immutable” yani değişmez/sabit yedekleme olarak tutulması önerilmektedir. Bu da fidye yazılım saldırılarına karşı aldığımız yedeklemelerin silinmemesini, şifrelenmemesini ve bozulmamasını sağlayarak yedeklemelerin fidye yazılımlara karşı güvenliğini arttırmaktadır.
[0]’da bir o kadar önemli; Kurtarma işlemi sonrasında, hipervizör, işletim seviyesi, uygulama seviyesinde herhangi bir sorunla karşılaşmamak için yedeklerimizi mutlaka felaketler başımıza gelmeden düzenli olarak test etmemiz gerekiyor. Bu testler sayesinde yedeklerimizi %100 olarak doğrulamış oluyoruz. Aldığımız yedeklemelerin, kurtarma sonrası tüm katmanlarda ve uygulama seviyesinde dahi sorunsuz çalışacağını test ederek garanti altına almış alıyoruz. Veeam, tüm bu testleri izole bir ortamda sizler için otomatik olarak yapabilmektedir. Arzu ederseniz bu testler sırasında, fidye yazılıma karşı yedeklemeleri kötü yazılım taramasından da tekrar geçirebilirsiniz.
Özetle, 3-2-1-1-0 altın kuralı bizlere hem en iyi uygulamaları anlatırken, bir yandan da bu mimari ile bizlere güvenli ve güçlü veri korumasını nasıl yapmamız gerektiği hakkında yol gösteriyor.
İş sürekliliği nedir?
İş sürekliliği, BT servislerimizde bir kesinti olduğunda, bir ürün veya servisin önceden tanımlanmış süreler içerisinde tekrar servis verebilmesi diyebiliriz; işimizin sürekliliğini sağlamamız gerekiyor. Yedekleme ve iş sürekliliği denilince, veri koruması alanında hep konuştuğumuz RTO ve RPO değerlerini de biraz açmakta fayda var.
RPO (Recovery Point Objective), verilerinizi kaybedebilmeyi göze alabileceğiniz maksimum zaman aralığını, RTO (Recovery Time Objective) ise verilerinizi kurtarmak için hedeflenen süreyi ifade etmektedir. Bu değerlerin belirlenmesi kurumunuzun veri koruma politikası çerçevesinde yapılmalıdır. Basitçe şu soruyu kendinize sorabilirsiniz; bir felaket durumunda, ne kadar veri kaybına katlanabilirim ve ne kadar süre içinde verilerimi/servislerimi çalışır hale getirmem gerekli?
RTO ve RPO değerleri farklı iş yükleri ve veri tipleri için farklı olacaktır. Örneğin, RPO değeriniz 24 saat ise, günlük yedeklemeler ile bu değeri sağlarken, bazı iş yükleriniz ve kritik verileriniz için bu değer 6 saat ve hatta dakikalar veya saniyeler olabilir. Sınıflandırmalar sonrası, belirlediğiniz politikalar doğrultusunda, veri ve iş yükü türüne, teknik altyapıya bağlı olarak, günde birden fazla kez yedekleme alınabilir veya replikasyon teknolojileri bu değerler rahatlıkla desteklenebilmektedir.
Özetle, iş sürekliliğini devamlı olarak sağlayabilmek için, sanal iş yüklerimizin farklı bir lokasyonda farklı bir veri merkezine çoğaltılmasını ve eşlenik olarak tutulmasını (replikasyon) sağlayabiliriz. Canlı iş yükünün bir kopyasını, dakikalar seviyesinde (Veeam Replication ile) ve hatta saniyeler seviyesinde (Veeam Continuous Data Protection) diğer bir veri merkezinde kapalı olarak tutabilir, ihtiyaç durumunda yük devrederek diğer veri merkezinde çalışır hale getirebilirsiniz. Hatta replikalar üzerinde geriye dönük saklama noktaları da tutabilir, kurtarma veya yük devretme işlemlerini bu saklama noktalarından kolaylıkla yapabilirsiniz. Sizlerin de tahmin edeceği üzere, iş sürekliliği esasında yedekleme ve kurtarma süreçlerinin bir tamamlayıcısı. Veeam Backup and Replication ile de tüm bu süreçleri tek bir konsoldan tek bir lisans ile sağlayabilirsiniz.
Veeam DataLabs
Veeam DataLabs, Veeam Backup & Replication içinde bulunan Laboratuvar ortamı oluşturma yeteneği diyebiliriz. Bu yetenek ile, üretim iş yüklerinin bir kopyalarını, yani oluşturulmuş yedeklemeleri ve/veya replikaları kullanarak, izole bir ortamda çalıştırmamıza olanak sağlar. Bu izole ortam içinde çalışan ilş yüklerimiz üretim ortamının tam bir kopyasıdır.
Laboratuvar ortamında izole olarak çalışan bu iş yüklerini bir çok senaryo için çok rahatlıkla kullanabilirsiniz; test, geliştirme, yazılım güncellemeleri ve yamaları test etmek, veri kurtarma ve afet kurtarma simülasyonları, sandbox ortamları oluşturma ve veri analitik ve raporlama vb. VDRO ile hazırladığımız planların testlerinin yapılabildiğinden bahsetmiştik. Bu testler için de Veeam Backup and Replication’ın Datalabs yetenekleri temel olarak kullanılıyor.
VDRO ile Zorluklardan hemen kurtulun!
BT dünyasında risk her zaman vardır. Önemli olan bu riski ne kadar azaltabildiğimiz. FK planlarının oluşturulması ve otomatik olarak kontrolü ve testleri ile riski önemli ölçüde azaltabilirsiniz. Hem bu testler ile RTO ve RPO hedeflerinizi kontrol edebilir, geri dönüş senaryolarının çalışabilirliğini test edebilirsiniz.
Felaket kurtarma planlarının sık sık test edilebilmesi için otomasyon özellikli bir felaket kurtarma çözümü gerekir. FK test sürecinin otomatikleştirilmesi, testlerin düzenli bir şekilde tekrarlı olarak gerçekleştirilmesini olanak sağlar ve kolaylaştırır. Yedeklemelerden, CDP ve Replikalara, depolama alanı entegrasyonlarına kadar uzanan iş sürekliliği ve FK süreçlerinizde, VDRO ile FK Planlarını oluşturabilir, test edebilir, uyumluluk süreçlerinize karşı hazır olabilirsiniz.
FK Planlaması ve Dokümantasyon
Başarılı bir felaket kurtarma planının ana yapı taşı kapsamlı ve güncel planlamadır. Dinamik olarak sürekli yapılandırma değişiklikleriyle karşılaşan ortamlar, gün geçtikçe daha büyük ve daha karmaşık hale geliyor. BT için de, iş sürekliliği için kritik olan her değişikliği manuel olarak yakalamak ve belgelemek neredeyse mümkün değil, mümkün olsa bile bu değişiklikleri bir orkestrasyon aracı olmadan FK planlarında tekrar uygulamanın, dokümantasyonların güncel tutulmasının neredeyse imkansız olduğunu sizlerde bilirsiniz.
VDRO ile sanal ortam değiştikçe otomatik olarak güncellenen ve yeniden yayınlanan olağanüstü durum kurtarma belgeleriyle, dokümantasyonlarınızı dinamik olarak güncel tutabilir, uyumluluk denetimleri, yasal gereksinimler için güncel belgeler sağlayabilirsiniz:
FK Testleri
Sık sık yapılabilen, tam ölçekli testler, kapsamlı bir felaket kurtarma planının başarısı için de kritik öneme sahiptir. Yine özellikle büyük ölçekteki ortamları düşündüğümüzde, birden fazla veri merkezlerinden oluşan ortamların karmaşıklığını düşündüğümüzde, kaynak ihtiyaçları, potansiyel son kullanıcı etkisi vb. süreçlerden dolayı, felaket kurtarma planının uygulanabilirliğinin testini genelde yapmamayı veya çok küçük bir ölçekte süreçlerin ilerleyebileceğinin (?) testini tamamlamayı tercih edebiliyoruz.
Yıllık felaket kurtarma testleri faydalı olsa da ne kadar sık felaket kurtarma testi gerçekleştirirseniz o kadar doğru sonucu elde edebiliriz. Felaket kurtarma planına yeterince kontrol altında tutulmazsa ve/veya güncellenmez ise, hızlı bir şekilde güncelliğini yitirir ve test edilmediğini de düşündüğümüzde, ihtiyaç anında başarılı ve sorunsuz bir yük devretme olasılığı oldukça düşüktür; uyumsuz bağımlılıklar, yakalanamayan değişiklikler, uygun olmayan süreçler, doğrulanmamış hizmetler ve uygulamalar ve yanlış başlatma sıraları… Felaket kurtarma testlerinin daha sık yapılması, felaket kurtarma planlarını doğrulamak ve karşılaşılan sorunları düzeltmek için bizlere ek fırsatlar sağlar ve başarı oranını artırır.
VDRO ile üretim iş yükleri üzerinde hiçbir etkide bulunmadan, istediğiniz sıklıkta otomatik felaket kurtarma planı testi ve hazırlık kontrolleri yapabilir, kurtarılabilirliği test ederek, kanıtlayabilir, manuel süreçlerden kurtularak maliyetleri düşürebilir, verimliliği ve korumayı en üst seviyeye çıkarabilirsiniz.
Uyumluluk
Felaket kurtarma denilince akla ilk gelenlerden bir tanesi BT servis veya hizmet kesintisi ve etkileri olsa da, gözden kaçabilecek önemli bir unsur ise uyumluluk süreçleridir. Kurum verilerinin güvenilirliği, bütünlüğü ve kullanılabilirliğine ilişkin sorumluluğunu sağlamak için yürürlükte bulunan yasalar, düzenlemeler ve standartlar… Uyumluluğu oluşturan düzenlemeler ve düşünmemiz gereken konular sektörden sektöre farklılık gösterse de uyumsuzluk bir seçenek olmamalıdır zira önemli finansal ve itibar sonuçlar doğurabilmektedir.
Raporlama
FK planlamasını zorlaştıran unsurlardan bir tanesi, planlarınızı raporlamak, güncellemek ve onu güncel tutmaktır. Her bir değişiklik sonrası 10’larca 100’lerce sayfayı manuel olarak tekrar tekrar incelemeyi, revize etmeyi, sonrasında kontrolünü sağlamayı düşünmek bile istemeyiz. VDRO ile FK planınızı rahatlıkla oluşturabilir, güncel tutabilirsiniz. Hatta neler olup bittiğini görebilmeniz ve uyum içinde kalabilmeniz için bir plan denetim günlüğü ile beraber gelmektedir.
FK Orkestrasyonunu ertelemeyin
Veeam Disaster Recovery Orchestrator ile felaket kurtarma süreçlerinizi hemen otomatikleştirin. Veri kurtarma süreçlerinizi bir sonraki seviyeye taşıyabilir, risklerinizi azaltabilir, zamandan tasarruf edebilir, daha da önemlisi akşam huzurla uyuyabilirsiniz.
Risklerinizi Azaltın
- Kanıtlanmış, basit ama güçlü VDRO yazılımı ile, yönetilen, denenmiş, test edilmiş ve gerçek bir FK planı oluşturup, riskinizi azaltın
- 1-tık ile RTO’larınızı karşılayabileceğinizi bilerek huzurla uyuyun.
- Üretim verilerinin kopyalarını yalnızca DR testi için değil, uygulama ekiplerinizin geliştirmelerini desteklemek veya farklı amaçlar için yeniden kullanarak yedeklemeleriniz (üretim ortamının bir kopyası!) ile üretim ortamını etkilemeden yenilikçi adımlar atın.
Zamandan tasarruf edin
- Olağanüstü durum kurtarmanın en çok zaman alan yönlerini otomatikleştirerek değerli zamanınızdan tasarruf edin.
- Tamamen özelleştirilebilir şablon ile felaket kurtarma planlarınızı günlük ve dinamik olarak oluşturun ve güncelleyin.
- FK testleri ve kurtarmalar sırasında uygulamaların çalışmasını otomatik olarak doğrulayın ve belgeleyin.
- Yaptığınız tüm manuel adımları otomatik olarak düzenleyerek belgeleyin.
Uyumluluk ve Kurtarma Planınıza Güven
- Otomatik olarak planlanmış testler ve kontrollerle, kurumunuzun RPO ve RTO değerlerine uyumluluğunu test edin, eksik varsa düzenleyin ve belgeleyin.
- Rol tabanlı erişim ile uygulama sahiplerine özel FK planları oluşturun ve test etme yetkisi verin.
- 1-Tık ile yük devretme ve kurtarma sağlayın.
- Uyumluluk süreçleriniz için FK hazırlığını belgelerle kanıtlayın.
Hemen Deneyin
Veeam Veeam Disaster Recovery Orchestrator’ı kendi gözünüzle incelemek ve denemek isterseniz 30 günlük ücretsiz Veeam Disaster Recovery Orchestrator deneme sürümünü websitemizden indirebilirsiniz: https://www.veeam.com/tr/disaster-recovery-orchestrator.html