CrowdStrike Incident Postmortem: Mangelhafter Entwicklungsprozess, Sünden der Programmiersprache C++ und Fehler bei Enterprise-IT-Beschaffung offenbart

CrowdStrike Incident Postmortem: Mangelhafter Entwicklungsprozess, Sünden der Programmiersprache C++ und Fehler bei Enterprise-IT-Beschaffung offenbart

Von
CTOL Editors
3 Minuten Lesezeit

CrowdStrike Vorfallanalyse: Mängel im Entwicklungsprozess von CrowdStrike, Sünden der C++-Sprache und Fehlschläge bei Unternehmens-IT-Beschaffung in Deutschland und Österreich aufgedeckt

Am 19. Juli 2024 kam es zu einem kritischen Vorfall mit der Cybersicherheitssoftware Falcon Sensor von CrowdStrike, der zu weitreichenden Beeinträchtigungen in verschiedenen Branchen weltweit führte. Der Vorfall hatte erhebliche Auswirkungen auf Sektoren wie Fluggesellschaften, Banken, Bahnanbieter, Supermärkte, Finanzdienstleister sowie Nutzer von Microsoft Azure Virtual Machines und Microsoft Office 365-Diensten. Die Ursache für den Vorfall wurde auf ein NULL-Zeiger-Problem in der C++-Sprache zurückgeführt, das zu katastrophalen Ausfällen in den Systemtreibern führte. Dieser schwerwiegende Fehler wirft ernsthafte Bedenken hinsichtlich der Softwareentwicklungspraktiken und der Eignung von C++ für moderne Entwicklung auf.

Schlüsselerkenntnisse

  1. Globalbeeinträchtigungen: Der Vorfall wirkte sich auf zahlreiche Branchen aus und verursachte Betriebschaos und finanzielle Einbußen.
  2. Ursache: Ein NULL-Zeiger-Problem im CrowdStrike Falcon Sensor, der in C++ geschrieben ist, löste den Ausfall aus.
  3. Finanzielle Auswirkungen: Die exakten finanziellen Einbußen sind noch nicht bestimmt, aber Unternehmen sahen sich mit Betriebsunterbrechungen und möglichen Entschädigungsforderungen konfrontiert.
  4. Entwicklungspraktiken: Der Vorfall offenbarte Mängel bei der Qualitätssicherung (QA) und der Veröffentlichungsverwaltung bei CrowdStrike.
  5. Eignung von C++: Die Komplexität und Schwierigkeit von C++ werden kritisiert, was Fragen zu seiner Verwendung in kritischer Software aufwirft.
  6. Fehlschläge bei Unternehmens-IT-Beschaffung: Der große Erfolg und Umsatz von CrowdStrike zeigten Skalenineffizienzen bei der Unternehmens-IT-Beschaffung. Unternehmen wählen häufig unteroptimalen Software aus aufgrund etablierter Geschäftsbeziehungen, aggressiven Marketings, Risikoaversion und komplexen Beschaffungsprozessen.

Analyse

Der Vorfall von CrowdStrike am 19. Juli enthüllte grundlegende Mängel in der Softwareentwicklung und -einführungspraxis. Die analysierte Ursache, ein NULL-Zeiger-Problem, hebt die mit der Verwendung von C++ in kritischen Anwendungen verbundenen Risiken hervor. In C++ weisen NULL-Zeiger auf eine ungültige Speicheradresse hin, und ein Versuch, auf eine solche Adresse zuzugreifen, kann das System zum Absturz bringen. Dieses Problem wurde durch unzureichende QA und Veröffentlichungsverwaltung bei CrowdStrike verstärkt, was dazu führte, dass ein fehlerhafter Treiber an Benutzer ausgegeben wurde.

Der Fehler von CrowdStrike, moderne Veröffentlichungsverwaltungstechniken wie Canary-Veröffentlichungen oder stufenweise Bereitstellungen zu implementieren, bedeutete, dass der defekte Update alle Benutzer gleichzeitig betraf. Diese mangelnde Vorsichtsmaßnahme und schlechte QA ermöglichten einen schweren Fehler zu Erreichen der Produktion, was zu globalen Beeinträchtigungen führte.

Die finanziellen Auswirkungen des Vorfalls sind erheblich. Unternehmen in verschiedenen Sektoren sahen sich mit Betriebsbehinderungen konfrontiert, was mögliche Entschädigungsforderungen von betroffenen Kunden nach sich ziehen könnte. Versicherer wie Beazley und Hiscox verzeichneten einen Rückgang ihrer Aktienkurse, da sie einen Anstieg von Cyber-Versicherungsansprüchen erwarteten. Die Aktie von CrowdStrike brach um 10 % ein, mit potenziell langfristigen Kosten zur Behebung des Problems und zum Wiederaufbau seines Rufs.

Darüber hinaus hat der Vorfall eine Diskussion über die Eignung von C++ für moderne Softwareentwicklung ausgelöst. Kritiker argumentieren, dass die Komplexität und das Potenzial für Fehler von C++ es weniger geeignet macht für die Entwicklung zuverlässiger und sicherer Software. Sie befürworten die Verwendung sicherer Sprachen wie Rust, die solche Speicherprobleme von Grund auf verhindern.

Wussten Sie schon?

Trotz der gravierenden Mängel, die dieser Vorfall offenlegte, erfreute sich CrowdStrike bemerkenswerter finanzieller Erfolge. Im Geschäftsjahr bis zum 31. Januar 2023 meldete CrowdStrike einen Anstieg des Umsatzes um 54 %, wodurch er 2,24 Milliarden US-Dollar erreichte. Für das Geschäftsjahr 2024 prognostizierte das Unternehmen einen Umsatz zwischen 2,96 Milliarden und 3,01 Milliarden US-Dollar. Dieser Erfolg, trotz der zugrunde liegenden Softwareprobleme, verdeutlicht ein breiteres Problem in der Unternehmens-IT-Beschaffung.

Warum haben suboptimale Softwarelösungen Erfolg?

  1. Geschäftsbeziehungen: Etablierte Anbieter verfügen oft über langjährige Beziehungen zu Unternehmensentscheidungsträgern, die Einfluss auf Beschaffungsentscheidungen nehmen.
  2. Marketing- und Vertriebstaktiken: Großanbieter investieren stark in Marketing, wodurch oft die tatsächliche Qualität ihrer Produkte in den Hintergrund tritt.
  3. Risikoaversion: Unternehmen neigen dazu, etablierte Anbieter zu bevorzugen, um das potenziell wahrgenommene Risiko zu minimieren, selbst wenn bessere Alternativen verfügbar sind.
  4. Komplexe Beschaffungsprozesse: Die bürokratische Natur von Beschaffungsprozessen kann Anbietern zugutekommen, die sich in diesen Komplexitäten gut auskennen.
  5. Kompatibilitätssorgen: Unternehmen priorisieren Lösungen, die Kompatibilität mit bestehenden Systemen gewährleisten.
  6. Entscheidungsfindung durch nicht-technische Führungskräfte: Beschlüsse werden manchmal von Führungskräften ohne tiefgreifendes technisches Wissen getroffen, die möglicherweise Markenpräferenzen priorisieren.
  7. Überladung mit Funktionen: Unternehmen können durch lösungsreiche Produkte beeinflusst werden, die zwar umfassend erscheinen, aber schwierig zu effektiv nutzen sind.

Diese Faktoren tragen zur Auswahl suboptimaler Software bei, was zu Ineffizienzen und potenziellen Betriebsunterbrechungen führen kann, wie am jüngsten CrowdStrike-Vorfall eindrucksvoll veranschaulicht.

Das könnte Ihnen auch gefallen

Dieser Artikel wurde von unserem Benutzer gemäß den Regeln und Richtlinien für die Einreichung von Nachrichten. Das Titelbild ist computererzeugte Kunst nur zu illustrativen Zwecken; nicht indikativ für den tatsächlichen Inhalt. Wenn Sie glauben, dass dieser Artikel gegen Urheberrechte verstößt, zögern Sie bitte nicht, dies zu melden, indem Sie uns eine E-Mail senden. Ihre Wachsamkeit und Zusammenarbeit sind unschätzbar, um eine respektvolle und rechtlich konforme Community aufrechtzuerhalten.

Abonnieren Sie unseren Newsletter

Erhalten Sie das Neueste aus dem Unternehmensgeschäft und der Technologie mit exklusiven Einblicken in unsere neuen Angebote