Viele beliebte Seiten waren nicht erreichbar
Die Cloud ist in aller Munde - doch was tun wenn die Lieblingsseite plötzlich nicht mehr funktioniert?
Diese Frage mussten sich Millionen Webnutzer und einige der beliebtesten Webseiten weltweit stellen. Passieren konnte dies, da sehr viele beliebte Seiten bei den Clouddiensten von Amazon (AWS) gehostet werden, und genau dieser Dienstleister durch eigenes Verschulden einen Ausfall produzierte.
Ein Tippfehler war Schuld?
Schuld war laut Amazon ein Tippfehler eines Administrators während einer routinemäßigen Überprüfung. Einige Server sollten geplant heruntergefahren werden und Ersatzsysteme sollten für die gestoppten Server einspringen. Doch statt einiger weniger Server wurde beinahe die gesamte Amazon-Infrastruktur heruntergefahren, was dazu führte, dass die komplette Amazon-Cloud neu gestartet werden musste.
Händler befürchten Umsatzeinbußen von 150 Mio USD
Laut dem Monitoringdienstleister Apica waren 54 der 100 beliebtesten Onlineshops weltweit durch den Ausfall nicht mehr erreichbar - die betroffenen Händler fürchten nun, dass sich die Einbußen beim Umsatz auf ca 150 Mio USD belaufen - dies dürfte der teuerste Tippfehler aller Zeiten gewesen sein.
Ironischerweise war von dem Ausfall auch die Webseite isitdownrightnow.com (zu deutsch "ist es gerade unten", d.h. nicht erreichbar) die die Verfügbarkeit von beliebten Webseiten und -diensten misst, ebenfalls von dem Ausfall betroffen. Amazons eigene Fehlerseite hingegen machte das Chaos perfekt: sie zeigte während des Ausfalls an, dass alles in Ordnung ist.
Problematisch: Monopolpildung
Die Monopolbildung im Cloudsegment ist, wie dieser Vorfall zeigt, problematisch: Wenn ein großer Teil des gesamten Webs in der Cloud eines einzigen Anbieters gehostet wird, kann im Falle einer Störung "das Internet" beinahe komplett ausfallen. Doch genau auf dieses Szenario steuert die Branche derzeit zu - Amazon und Google, die beiden größten Cloud-Anbieter, betreiben den größten Teil der beliebtesten Seiten im Netz.
Fazit:
Auch die großen Cloud-Anbieter sind nicht gegen Fehler gefeit - in diesem Fall hat ein Tippfehler dafür gesorgt, dass große Teile des Internets nicht erreichbar waren. Durch die Zentralisierung war dieses Problem auch noch hausgemacht - je mehr beliebte Webseiten auf ein und derselben Infrastruktur laufen, desto größer der weltweite Ausfall bei einem Fehler oder einem Angriff. Eine breitere Verteilung würde dieses Problem zwar nicht lösen, aber es würde eben nicht gleich alles ausfallen, wenn die Infrastruktur eines Anbieters nicht verfügbar ist.
Quellen:
http://www.sueddeutsche.de/digital/internet-der-vermutlich-teuerste-tippfehler-in-der-geschichte-des-internets-1.3403460
http://t3n.de/news/amazon-aws-ausfall-zentralisierung-800871/
https://aws.amazon.com/de/message/41926/