Connect with us

Vordenker

Warum Ihre E-Commerce-Website in dieser Weihnachtssaison einen aktiven Multi-Cloud-Ansatz benötigt

mm

Für E-Commerce-Führer bringen die Feiertage zwei Gewissheiten mit sich: einen massiven Zustrom von Shoppern und ein erhöhtes Risiko von Cloud-Provider-Ausfällen. Große Cloud-Störungen scheinen häufiger und verheerender zu werden. Die AWS-Region US-East-1 hat beispielsweise eine Geschichte von erheblichen Störungen während der Feiertagsaison. Ebenso hat jedes Jahr im Januar Microsoft Azure tendenziell Netzwerkverzögerungsprobleme oder Netzwerkausfälle aufgrund seines Release- oder Testplans in bestimmten Regionen. Und wir müssen nur zurückblicken auf den vergangenen Juni, als ein großer Google-Cloud-Ausfall eine breite Palette von Anwendungen beeinträchtigte, um daran erinnert zu werden, dass kein einzelner Anbieter immun ist.

Wenn Sie für den Betrieb eines E-Commerce-Unternehmens verantwortlich sind, möchten Sie nicht herausfinden, dass, obwohl Sie alles richtig eingerichtet haben, etwas während der kritischsten Zeit des Jahres aufhört zu funktionieren. Diese Trends von Cloud-Provider-Ausfällen und -Problemen müssen nicht auf Ihrem Radar sein, und ehrlich gesagt, sollten sie es auch nicht. Wenn Sie ein Site-Reliability-Engineer sind, sollten Sie sich nicht darüber Sorgen machen, ob ein Cloud-Plattform-Ausfall Ihre Anwendung beeinträchtigen wird, noch sollten Sie versuchen, Ihre Infrastruktur auf die Schnelle während eines Problems anzupassen. Stattdessen sollten Sie überdenken, was Sie über Multi-Cloud wissen.

Multi-Cloud-Anwendungen

Wenn Ihre Organisation AWS-, Azure- und GCP-Gebühren zahlt, haben Sie tatsächlich alle drei Clouds zur Verfügung. Das gesagt, während Sie möglicherweise alle drei verwenden, ist es wichtig, zu überprüfen, was passiert, wenn Sie eine Ebene tiefer gehen. Sind einige Ihrer Anwendungen AWS-, Azure- oder GCP-spezifisch? Werden sie weiterhin funktionieren, wenn ein Cloud-Provider ausfällt und Sie schnell zu einem anderen wechseln müssen?

Ihre Anwendung muss perfekt auf allen Clouds funktionieren. Das ist, was eine wahre Multi-Cloud-Konfiguration ausmacht. Wenn Sie cloud-agnostisch sein möchten, können Sie nicht einfach für Multi-Cloud zahlen; Sie müssen sicherstellen, dass Ihre Anwendungen auch Multi-Cloud sind.

Darüber hinaus führt die Abhängigkeit von einem einzelnen Anbieter zu inhärenten Einschränkungen bei der Rechenleistung, API-Rate-Limiting und regionaler Verfügbarkeit. Eine wahre Multi-Cloud-Architektur erhöht Ihre Gesamtrechenleistung und bietet Resilienz gegen diese Einschränkungen. Sie ermöglicht es Ihnen, Ihre Kapazität auf Abruf über die Grenzen eines einzelnen Anbieters hinaus zu skalieren, Ihre Kapazität schnell über geografische Regionen hinweg zu erweitern und eine konsistente Leistung während der Spitzen-Shopping-Tage sicherzustellen. Aber eine portable, cloud-agnostische Anwendung zu haben, ist nur der erste Schritt; der nächste Schritt ist, sie in einer wirklich resilienten Architektur zu bereitstellen.

Skalierung auf einen aktiven-aktiven Ansatz

Dafür ist eine ernsthafte Vorbereitung durch DevOps erforderlich. Es ist unglaublich schwierig, eine 100% genaue Business Continuity Disaster Recovery (BCDR)-Strategie zu haben, da es bei der Ausführung Ihrer Betriebe live viele Punkte des Versagens gibt. Sie möchten Ihre BCDR-Strategie nicht während eines Ausfalls testen, also können Sie möglicherweise nur vorhersehbare Szenarien vorbereiten und entsprechend planen.

Mein Rat an Site-Reliability-Engineer ist, für das Versagen zu planen. Das bedeutet, dass Sie eine sekundäre oder sogar tertiäre Cloud im aktiven Zustand haben. Eine BCDR-Strategie, die auf einen einzelnen Anbieter beschränkt ist, ist ein einzelner Punkt des Versagens; wenn der Anbieter-Steuerungsebene oder Netzwerkrückgrat ausfällt, ist Ihr gesamter Wiederherstellungsplan nutzlos.

Während der Feiertagsaison ist es üblich, dass die Anzahl der Besucher plötzlich ansteigt und Ihre Plattform oder Anwendung beginnt, mit reduzierter Leistung zu arbeiten. Wenn Sie bereits eine Kopie Ihrer funktionierenden Anwendung erstellt haben, eine sekundäre, können Sie zur Lastverteilung wechseln, um einige Anfragen an die andere Instanz Ihrer Anwendung umzuleiten.

Dieser aktive-aktive Ansatz bedeutet, dass Sie Ihr vollständiges Produkt dupliziert haben und es an einem anderen Ort ausführen. Wenn Ihr primärer Cloud-Provider einen schweren Rückgang oder Ausfall erleidet, können Sie nahtlos 100% Ihres Datenverkehrs auf den sekundären Anbieter über DNS oder einen globalen Lastenausgleich umleiten und ihn zum primären Einstiegspunkt machen, ohne dass Ihre Kunden beeinträchtigt werden.

Die tatsächlichen Kosten für den Verzicht auf Multi-Cloud

Während die Kosten für den Betrieb einer sekundären Cloud nicht trivial sind, sind sie im Vergleich zum Geschäftseinfluss eines großen Ausfalls unbedeutend: Kunden nach einem Zuverlässigkeitsversagen zu entschuldigen, ihnen zu versichern, dass es nicht wieder passieren wird, und sie davon zu überzeugen, dass sie nicht zu einem Ihrer Wettbewerber wechseln. Lassen Sie uns auch nicht vergessen, alle verlorenen Umsätze, die Sie nicht wieder gewinnen können. Bei FluidCloud habe ich diese Szene immer wieder erlebt: Unternehmen investieren stark in einen einzelnen Anbieter, nur um sich auf der falschen Seite eines Ausfalls wiederzufinden, ohne sofortige Abhilfe.

Das gesagt, ist es bereits schwierig genug, Ihre Kosten zu kontrollieren, wenn Sie nur einen Cloud-Provider verwenden; Ihre Cloud-Kosten sehen wahrscheinlich wie ein exponentielles Diagramm aus. Wenn Sie mehrere Clouds adoptieren, wird dieses exponentielle Diagramm nur noch steiler aussehen.

Wenn Sie Ihre Infrastruktur von Ihrem primären Cloud duplizieren, möchten Sie natürlich nicht, dass Ihre Kosten verdoppeln. Ich empfehle daher, sich auf günstigere Clouds zu konzentrieren, die eine wettbewerbsfähige Leistung zu einem niedrigeren Preis bieten. Wenn Sie eine sekundäre Cloud in einem günstigeren Cloud haben, haben Sie immer noch eine vollständige aktive-aktive Redundanz, aber zu einem geringeren Kosten. Es ist ein Gewinn für beide Seiten.

Schlussgedanken

Das Ausführen Ihrer Anwendungen aktive-aktive über mehrere Cloud-Provider hinweg bedeutet nicht einfach, eine Sicherungskopie zu erstellen. Es bedeutet, für Echtzeit-Resilienz zu bauen, sicherzustellen, dass Ihr Unternehmen keinen einzelnen Punkt des Versagens hat, und eine konsistente Geschwindigkeit auch während des Datenverkehrsspitzen zu bieten.

In dieser Weihnachtssaison sollten Sie nicht einfach auf Zuverlässigkeit hoffen. Bauen Sie darauf. Konstruieren Sie Ihre Systeme, um konsistent zu laufen, unabhängig davon, welcher Cloud-Provider oder welche Region ausfällt. Bieten Sie eine fehlerfreie Kundenerfahrung, indem Sie eine wahre aktive-aktive, Multi-Cloud-Architektur annehmen.

Harshit Omar ist der Co-Founder und CTO von FluidCloud, wo er die Zukunft der Cloud-Infrastruktur aufbaut – Unternehmen ermöglicht, Workloads nahtlos in multi-cloud-Umgebungen zu migrieren, zu replizieren und zu optimieren. Er war zuvor der erste Ingenieur bei Accurics, wo er die Kernentwicklungsbestrebungen auf dessen Policy-Engine und Cloud-Sicherheitsplattform leitete.

Mit tiefem Fachwissen in Go, Kubernetes, Terraform und Cloud-Compliance hat Harshit über ein Jahrzehnt hinweg widerstandsfähige Systeme bei AWS, Azure und GCP entworfen.

Seine Mission ist es jetzt, Cloud-Lock-in zu eliminieren und Infrastruktur so portabel und widerstandsfähig wie Code zu machen.