Azure Chaos Studio

 
  azure

Chaos engineering je metodologie, která nám pomáhá dosáhnout konzistentní spolehlivosti tím, že posiluje služby proti poruchám v prostředí. Takový chaos, neboli výpadek, obvykle simulujeme plánovaným výpadkem systémů nebo zaváděním chyb, které způsobují selhání součástí systémů. Během této simulace pak pozorujeme, monitorujeme a reagujeme. Učíme se tak zlepšovat spolehlivost. Tyto testy bychom měli provádět pravidelně podle toho, jak se naše prostředí nebo systémy, které využíváme vyvíjí.

Někdy je ale obtížné simulovat přesné charakteristiky chování služby mimo produkční prostředí. V případě řešení, která stavíme v Azure cloudu, koncový zákazníci nemohou jen tak jednoduše vypnout celý Azure Region nebo konkrétní cloudovou službu, aby zjistili jak se jejích aplikace zachová. Nativní cloudové architektury zjednodušují nasazení a správu, ale týmům může chybět jistota, že při jejich používání mohou zůstat odolné vůči selhání.

Právě pro takové případy Microsoft přichází s novinkou pod názvem Azure Chaos Studio.

Text  Description automatically generated

Tato nová služba umožňuje bezpečným a kontrolovaný způsoben organizovat simulaci chyb v prostředí Azure. Momentálně je možné simulovat 25 typů poruch, a bude jich přibývat víc.

Azure Chaos Studio je plná integrovaná PaaS služba, která nám je k dispozici na několik kliknutí. Stačí definovat, co chceme vyzkoušet a kliknout na tlačítko Start. Okamžitě tak můžeme simulovat například přetížení CPU, RAM nebo disků, výpadek sítě nebo zvýšení latencí na sítí, výpadek DNS nebo pozastavení služeb. Nemusíme na to psát ani udržovat vlastní skripty.

Graphical user interface, text, application, email  Description automatically generated

Chaos Studio používá Azure Resource Manager (ARM), který usnadňuje nasazení a spouštění chaosových experimentů stejným způsobem, jakým uživatele spravují svou infrastrukturu – využívá šablony ARM, Azure Policy, řízení přístupu na základě rolí (RBAC) a více. Chaos Studio se také integruje s Azure Application Insights a využívá Azure Active Directory k zabezpečení přístupu k prostředkům. V orchestrátoru výpadku je tak možné vytvářet složité scénáře a experimenty, které replikuji incidenty ze skutečného světa. Poruchy je možné spouštět postupně a paralelně, můžeme přidávat různá časová zpoždění, definovat délky trvání jednotlivých výpadků nebo seskupovat cílové zdroje napříč regiony. Chaos Studio také používá sofistikovaný model zařazování zdrojů a oprávnění, který zajišťuje, že vkládání chyb probíhá pouze autorizovanými uživateli proti autorizovaným zdrojům využívajícím autorizované chyby. Nemělo by tak dojít k zneužití služby.

Nejlepší na tom je, že celou situací řídíme z jednoho místa a vytváříme tak řízený chaos. Experiment je možné kdykoliv pozastavit a chybu odstranit.

Sdílej v médiích

azure-chaos-studio

Kontakt

Nenašli jste, co hledáte? Pošlete nám zprávu a zůstaneme s vámi ve spojení.

* Vyžadované pole. Osobní data použijeme pouze pro vypracování odpovědi na dotaz. Pravidla zpracování osobních údajů.

* Souhlas se zpracováním údajů

map us
map eu