08 Sierpnia 2024 r. / Aktualności

Globalna awaria Windowsa związana z aktualizacją CrowdStrike

Patryk Szczepaniak

8 min. czytania

Przyczyny awarii – techniczna analiza Microsoftu

W najnowszym wpisie na oficjalnym blogu Microsoftu, David Weston, wiceprezes ds. bezpieczeństwa przedsiębiorstw i systemów operacyjnych, przedstawił szczegółową analizę przyczyn tej awarii. Głównym problemem okazał się błąd związany z bezpieczeństwem pamięci – konkretnie nieprawidłowy odczyt pamięci w sterowniku CSagent.sys, rozwiniętym przez CrowdStrike.

Microsoft, wykorzystując narzędzia takie jak WinDBG Kernel Debugger, przeanalizował zrzuty awarii jądra Windows, co pozwoliło na potwierdzenie wniosków CrowdStrike dotyczących tego błędu. Problem wystąpił w module csagent.sys, który jest zarejestrowany jako sterownik filtra systemu plików, często używany przez agentów antywirusowych do monitorowania operacji plikowych.

Sterowniki w trybie jądra i użytkownika

Aby zrozumieć, dlaczego problem zaktualizowanego oprogramowania CrowdStrike miał tak poważne konsekwencje, warto najpierw zrozumieć, jak działa system operacyjny Windows. Windows operuje w dwóch podstawowych trybach: trybie jądra (kernel mode) i trybie użytkownika (user mode).

W trybie użytkownika działają standardowe aplikacje, które nie mają bezpośredniego dostępu do sprzętu systemowego ani pamięci. Aplikacje w tym trybie są izolowane od bezpośredniego dostępu do zasobów sprzętowych, co zwiększa bezpieczeństwo i stabilność systemu.

Z kolei tryb jądra ma pełny dostęp do całego sprzętu systemowego oraz pamięci. W tym trybie działają kluczowe komponenty systemu operacyjnego, w tym sterowniki urządzeń, które muszą bezpośrednio komunikować się z hardwarem. Przykładowo, sterowniki trybu jądra mogą monitorować i kontrolować operacje plikowe, zarządzać pamięcią i kontrolować dostęp do zasobów systemowych.

Sterowniki trybu jądra, takie jak te używane przez CrowdStrike, zapewniają szeroką widoczność systemu i mogą być załadowane we wczesnym etapie rozruchu, co pozwala na wykrycie zagrożeń takich jak bootkity i rootkity. Jednak działanie na poziomie jądra wiąże się z ryzykiem mniejszej odporności na błędy. Kod działający na tym poziomie wymaga intensywnej walidacji, ponieważ nie może po prostu zakończyć się błędem i zrestartować jak normalna aplikacja użytkownika.

Lekcje na przyszłość

Windows oferuje wiele narzędzi i funkcji bezpieczeństwa, które mogą zwiększyć niezawodność systemów. Przykładowo, operacje zarządzania i aktualizacji można przeprowadzać w trybie użytkownika, podczas gdy jedynie niezbędne komponenty działają w trybie jądra, aby zbierać dane i egzekwować zabezpieczenia. To podejście pomaga zmniejszyć ryzyko problemów z dostępnością. Microsoft dostarcza również technologie takie jak Virtualization‑based security (VBS) oraz chronione procesy, które pozwalają ograniczyć konieczność używania kodu jądra w rozwiązaniach bezpieczeństwa.

Wnioski

Awaria Windowsa spowodowana aktualizacją CrowdStrike przypomina nam, że nawet największe firmy technologiczne nie są w stanie zagwarantować 100% dostępności swoich usług. Kluczowe jest, jak szybko i skutecznie środowisko biznesowe potrafi wrócić do stanu sprzed awarii. Bezpieczeństwo i stabilność systemów IT zależą nie tylko od wybranej infrastruktury, ale przede wszystkim od zespołu ludzi, którzy ją planują, obsługują i utrzymują.

Nie ma jednej uniwersalnej odpowiedzi na wyzwania związane z bezpieczeństwem i dostępnością. Wybór dostawcy to tylko część równania. Najważniejsze jest posiadanie doświadczonego i kompetentnego zespołu, który potrafi przewidzieć różne scenariusze, przygotować odpowiednie procedury i skutecznie reagować na incydenty.

Podsumowanie

Awaria CrowdStrike pokazuje, jak ważne jest odpowiednie przygotowanie na ewentualne awarie i posiadanie solidnej strategii odzyskiwania. Najważniejsze jest jednak posiadanie doświadczonego zespołu, który potrafi przewidzieć i zarządzać różnymi scenariuszami awaryjnymi. Wnioski z tego incydentu powinny skłonić firmy do przemyślenia swoich strategii dotyczących bezpieczeństwa i dostępności. Wybór właściwej infrastruktury, przygotowanie procedur oraz posiadanie kompetentnego zespołu to kluczowe elementy zapewniające ciągłość działania w obliczu nieprzewidzianych zdarzeń.

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Globalna awaria Windowsa związana z aktualizacją CrowdStrike

Przyczyny awarii – techniczna analiza Microsoftu

Sterowniki w trybie jądra i użytkownika

Lekcje na przyszłość

Wnioski

Podsumowanie

Patryk Szczepaniak

Zobacz także

Przeglądarki AI – czy oddasz bezpieczeństwo za wygodę?

Awaria Cloudflare. Co naprawdę się stało i co…

AWS US‑EAST‑1: jedna awaria, globalny kłopot

Atak hackerski na Jaguar Land Rover: co się…

VPS czy serwer dedykowany – co wybrać do…

Infrastruktura na miarę Mistrzów ‑ case study Lech…

Nadchodzą zmiany! Certyfikaty TLS ważne tylko 47 dni

Open Source vs. SaaS ‑ którą platformę e‑commerce…

Nie‑taki‑znów‑nowy backdoor zagrażający sklepom na Magento

CyberSec w social mediach: alternatywne sposoby budowania społeczności

Co to jest wirtualizacja? Poznaj jej rolę w…

Cyberprzestępczy trend roku 2025: Infostealery

Hosting serwerów dedykowanych – zarządzana infrastruktura dla e‑commerce

CyberSec w social mediach: YouTube

CyberSec w social mediach: Pinterest

CyberSec w social mediach: TikTok

CyberSec w social mediach: X (dawny Twitter)

CyberSec w social mediach: LinkedIn

CyberSec w social mediach: Facebook + Instagram

Sekundy, które przynoszą zyski ‑ jak infrastruktura e‑commerce…

Ataki cyber‑fizyczne, czyli gdy zagrożone są nie tylko…

Kalendarz e‑commerce 2025 – eventy i wydarzenia branżowe

Miliard dolarów okupu, czyli co warto wiedzieć o…

Jak utrzymać stabilne obciążenie infrastruktury serwerów podczas Black…

Code freeze przed Black Friday ‑ dlaczego zamrożenie…

Dlaczego warto dzielić się planami z hostingodawcą przed…

Komunikacja i współpraca kluczem do sukcesu podczas Black…

Microsoft 365 dla firm jako narzędzie transformacji cyfrowej

CosmicSting czyli najnowszy atak na Magento ‑ jak…

Kalendarz e‑commerce 2024 ‑ eventy i wydarzenia

Analiza post‑mortem jako narzędzie ciągłego doskonalenia zespołów IT

Globalna awaria Windowsa związana z aktualizacją CrowdStrike

Niewidzialni bohaterowie IT, czyli jak admini tworzą fundamenty…

Czy Magento odeszło do lamusa?

Czy Twoja aplikacja nadaje się na Kubernetes?

Dlaczego strona wolno się ładuje, a serwer nie…

Terraform ‑ rewolucja w zarządzaniu infrastrukturą IT

Skuteczne zarządzanie dyżurami i linią wsparcia 24/7

Testy wydajnościowe serwisu, czyli jak sprawdzić, ile ruchu…

5 dolarów za 5 minut, czyli czym jest…

Kiedy VPS dla Magento to za mało?

Po co Ci chmura? – czyli cloud computing…

Awaria DNS – czemu strona nie działa?

Dlaczego piątkowe deploymenty to zły pomysł?

Awaria serwera ‑ co robić?

Fakty i mity cyberbezpieczeństwa

Ataki hakerskie oparte o socjotechnikę, czyli człowiek jako…

10 najczęściej popełnianych błędów bezpieczeństwa w branży e‑commerce

Kalendarz IT 2024 – wydarzenia branżowe dla adminów…

Świąteczna integracja zespołu w Krakowie

Czy warto zatrudnić admina w firmie?

Dekalog DevOpsa

10 zasad dobrej współpracy programistów i DevOpsów

10 biurowych life hacków: Office 365

Microsoft 365. Jaki plan wybrać dla Twojej organizacji?

Zarządzanie ryzykiem IT w chmurze: Azure Site Recovery…

Czy cyber ubezpieczenie wystarczy, żeby zabezpieczyć biznes przed…

Disaster Recovery Plan (DRP) ‑ czym jest i…

Wewnętrzna transformacja infrastruktury IT, czyli Centuria od kuchni

Vendor Lock‑in: uzależnienie od dostawcy czy usprawnienie procesów?

Dług technologiczny w świecie IT: tanie rozwiązania dziś…

Nie samą pracą człowiek żyje ‑ czyli integracja…

Bezpieczeństwo i niezawodność w e‑commerce. Dlaczego warto wybrać…

PCI‑DSS – co musisz wiedzieć o tej normie…

Największe sklepy online trzymają dane na ich serwerach.…

Kompleksowe porównanie dystrybucji Linuxa

Wysoka Dostępność (High Availability) infrastruktury serwerowej: Klucz do…

DevOps i CI/CD w projektach e‑commerce

Wybór optymalnego serwera dla Magento

Współpraca z jednym z największych projektów Magento w…

Mage‑OS: stowarzyszenie dla osób związanych z Magento

„Jak przygotować e‑sklep na zwiększony ruch?” (zaproszenie na…

Czy ktoś może zagrozić Magento? Jak mądrze wybrać…