Connect with us

Ξεκινήστε την Προετοιμασία Τώρα για την Επόμενη Διακοπή του Cloud

Ηγέτες σκέψης

Ξεκινήστε την Προετοιμασία Τώρα για την Επόμενη Διακοπή του Cloud

mm

Οι μεγάλες διακοπές cloud όπως αυτή της εβδομάδας από το AWS είναι αναπόφευκτες. Αυτές οι τέσσερις μεθόδοι μπορούν να βοηθήσουν την εταιρεία σας να συνεχίσει.

Με απίστευτες ώρες χαμένης παραγωγικότητας, οικονομικά συστήματα διαταραχθηκαν για εκατομμύρια χρηστών, και πιθανώς εκατοντάδες δισεκατομμύρια δολάρια χαμένα, η διακοπή του AWS αυτή την εβδομάδα ήταν αναμφισβήτητα μια φριχτή μέρα για τις παγκόσμιες ομάδες IT. Βέβαια, ήταν επίσης η χειρότερη παγκόσμια καταστροφή cloud από την τελευταία… και μέχρι την επόμενη.

Ανεξάρτητα από το αν είστε στο AWS, GCP, Azure, ή σε οποιαδήποτε άλλη πλατφόρμα, οι μεγάλες διακοπές είναι μια δεδομένη πραγματικότητα του cloud computing. Τι μπορεί να κάνει η εταιρεία σας για να μειώσει τον κίνδυνο; Παρακάτω, θα προτείνω τέσσερα βήματα που η ομάδα σας μπορεί να thựcήσει αμέσως.

Φέρτε τη σκεπτικιστική σας στάση – και κάντε την έρευνά σας.

Συχνά, οι ομάδες θα προκαλέσουν καταστροφή περνώντας σε διαταραχές cloud με την υπόθεση ότι οι μεγάλες εταιρείες cloud είναι εγγενώς αξιόπιστες. Βέβαια, οι πιο αξιόπιστες εταιρείες έχουν κερδίσει τη φήμη τους για έναν λόγο. Ταυτόχρονα, κάθε cloud και hyperscaler προσφέρει eine ευρεία γκάμα επιλογών υποδομής – το AWS North America μόνο έχει 31 Availability Zones και 31 Edge Network Locations – και ορισμένες επιλογές είναι πολύ πιο αξιόπιστες από τις άλλες.

Πράγματι, η περιοχή US-EAST-1 του AWS, η αιτία της διακοπής αυτή την εβδομάδα, έχει πίσω από τις μεγάλες διακοπές το 2020, 2021, και 2023, και ήταν μακροχρόνια γνωστή σε ορισμένα IT κύκλους ως η λιγότερο αξιόπιστη περιοχή. Πολλές εταιρείες πιθανότατα κατανόησαν την κατάσταση αλλά έπραξαν ένα υπολογισμένο ρίσκο δεδομένης της χαμηλής τιμής της περιοχής και των πολλών προσφορών. Αλλά δεδομένης της έκτασης της διακοπής, είναι αδύνατο να μην σκεφτείτε πόσες εταιρείες πάρθηκαν ολοσχερώς από το ξαφνικό γεγονός – και θα είχαν σίγουρα επιλέξει τις πιο αξιόπιστες περιοχές εάν είχαν γνώση των ανταλλαγών. Προσωπικά, έχω συναντήσει ηγέτες IT που επέλεξαν να μετακινηθούν σε άλλες περιοχές του AWS μόνο μετά από κακές εμπειρίες με το US-EAST-1 στο παρελθόν.

Το μάθημα εδώ είναι να κάνετε την έρευνά σας όταν πρόκειται για επιλογές υποδομής cloud, ανεξάρτητα από το ποιο cloud εργάζεστε. Τόποι για να ξεκινήσετε περιλαμβάνουν δωρεάν εργαλεία όπως cloudprice, Cloudping, και οι ιστορικές προβολές περιστατικών από τα εργαλεία Cloud Service Health που παρέχονται από hyperscalers.

Επιλέξτε portable αντί για cloud-φυσικό.

Όταν αρχιτεκτονείτε ρυθμίσεις cloud, ο απλούστερος δρόμος είναι να πάτε cloud-φυσικό. Αλλά ενώ είναι βολικό να επιλέξετε εφαρμογές που έχουν κατασκευαστεί από και για τον παροχέα cloud σας, αυτές οι cloud-φυσικές επιλογές σας αφήνουν πιο εκτεθειμένες εάν το cloud σας πάθει διακοπή.

Για να αποφύγετε这一 επιπλέον στρώμα εξάρτησης από το cloud, επιλέξτε ανεξάρτητες και/ή ανοιχτού κώδικα προϊόντα όπου είναι δυνατό. Ορισμένα παραδείγματα αντικαταστάσεων περιλαμβάνουν τα παρακάτω:

Κατηγορία

Παράδειγμα Φυσικής Προσφοράς

Ανοιχτές Εναλλακτικές Επιλογές Περιλαμβάνουν…

Αυθεντικοποίηση & Ταυτότητα

AWS Cognito

Keycloak

Αναζήτηση

Azure Monitor

Elasticsearch

Σχεσιακές Βάσεις Δεδομένων

Google Cloud SQL

PostgreSQL

NoSQL Βάσεις Δεδομένων

AWS DynamoDB

MongoDB

Διαχείριση Container

Azure Kubernetes Service (AKS)

Kubernetes

Παρακολούθηση & Παρατηρησιμότητα

Google Cloud Monitoring

Prometheus + Grafana

Ουρές Μηνυμάτων

AWS SQS/SNS

Apache Kafka

Αποθήκευση Αντικειμένων

Azure Blob Storage

MinIO

Πύλη API

Google Cloud API Gateway

Kong

Για να είμαι σαφής, η κατασκευή περισσότερου του σταθμού cloud σας από το μηδέν σημαίνει περισσότερη δουλειά για τις ομάδες σας. Ωστόσο, με την εμπειρία μου, μια φορά που έχετε την υποδομή σε λειτουργία, δεν υπάρχει σχεδόν καμία διαφορά μεταξύ της προσθήκης φόρτου εργασίας σε μια καθιερωμένη υποδομή ή της λειτουργίας σε μια φυσική cloud. Και τα οφέλη όσον αφορά την ανθεκτικότητα – όχι μόνο την μείωση της εξάρτησης από το cloud – κάνουν τις ανεξάρτητες επιλογές εξαιρετικά αξιοποιήσιμες.

Μηχανική για αποτυχία.

Δεδομένου ότι οι αποτυχίες cloud θα συμβούν, βεβαιωθείτε ότι σχεδιάζετε τα προϊόντα σας με την αποτυχία του cloud στο μυαλό. Ένα παράδειγμα να κοιτάξετε είναι η Datadog: σε ένα περιστατικό του 2023, η εταιρεία έχασε ξαφνικά την πρόσβαση σε πάνω από το μισό των κόμβων Kubernetes στην παραγωγή και επανασχεδίασε完全 την προσέγγισή της για την καταστροφή. Οι αλλαγές περιελάμβαναν την αφαίρεση αρχιτεκτονικών φραγμών και την αντιμετώπιση τεχνικού χρέους ώστε οι μερικές αποτυχίες να μην διαδοθούν στο σύστημα, τη βελτίωση της εισαγωγής και αποθήκευσης δεδομένων για μεγαλύτερη διαθεσιμότητα δεδομένων κατά τη διάρκεια διακοπών, και την κατασκευή συστημάτων για αυτόματη ανάκτηση σε κλίμακα. Ένας εξαιρετικός τόπος για να ξεκινήσετε στο ταξίδι σας είναι να ακολουθήσετε την σύσταση της Datadog να «ξεκινήσετε με αυτό που είναι σημαντικό για τον τελικό χρήστη» και να κατασκευάσετε φραγμούς για προστασία αυτού που έχει σημασία περισσότερο.

Τρέξτε τουλάχιστον σε δύο clouds.

Βέβαια, ο καλύτερος τρόπος για να μην είστε υπό την επήρεια των αποτυχιών cloud είναι η αναπαραγωγή multicloud. Η επίτευξη αληθινής ροής multicloud είναι ένα τεράστιο έργο για πολλές εταιρείες,既然 είναι εξαιρετικά δύσκολο να μεταφράσετε την υποδομή από ένα cloud σε ένα άλλο. Αλλά η κατασκευή υποδομής σε δύο clouds είναι ένα ισχυρό – και συχνά δυνατό – σημείο να ξεκινήσετε. Κρίσιμο για να κάνετε αυτό να λειτουργήσει είναι να έχετε μια ομάδα στη θέση σας με έναν εμπειρογνώμονα σε κάθε cloud που τρέχετε.

Για να είμαι σαφής, τίποτα δεν μπορεί να προστατεύσει完全 τις εταιρείες από την επίδραση μιας τεράστιας διακοπής όπως αυτή που είδαμε αυτή την εβδομάδα. Αλλά με την σωστή έρευνα, μια προσεγγιστική προσέγγιση, μηχανική για αποτυχία, και χρήση «δύο clouds» ως εφαλτήριο για αληθινή multicloud, οι εταιρείες μπορούν να είναι πολύ πιο ευέλικτες όταν η επόμενη (και δυστυχώς αναπόφευκτη) μεγάλη διακοπή cloud συμβεί.

Ο Harshit Omar είναι ο συνιδρυτής και τεχνικός διευθυντής της FluidCloud, όπου κατασκευάζει το μέλλον της υποδομής cloud—ενεργοποιώντας τις επιχειρήσεις να μεταναστεύουν, να αναπαράγουν και να βελτιστοποιούν τις εργασίες σε πολλαπλά περιβάλλοντα cloud. Προηγουμένως ήταν ο πρώτος μηχανικός στην Accurics, όπου ηγήθηκε των βασικών προσπαθειών ανάπτυξης στο μηχανισμό πολιτικής και την πλατφόρμα ασφάλειας cloud.

Με βαθιά εμπειρογνωσία σε Go, Kubernetes, Terraform και συμμόρφωση cloud, ο Harshit έχει περάσει πάνω από μια δεκαετία σχεδιάζοντας ανθεκτικά συστήματα σε AWS, Azure και GCP.

Το όραμά του τώρα είναι να εξαλείψει τον κλειδωμένο cloud και να κάνει την υποδομή τόσο φορητή και ανθεκτική όσο ο κώδικας.