2019年8月23日、悪夢は突然訪れた。ステーションメモリーズ(略称:駅メモ)が繋がらないのだ。
これから小さな旅行でもしようと思ったその刹那、突如現る「メンテナンス中」の文字。障害である。
多くのユーザーから声援が送られている運営アカウントを見ていると、一つ苦情のリプライを見つけた。
貴社は「運用コストを削減できるから、またより安定した環境を提供できるから」という理由で、自社サーバ運用を放棄したと記憶しています。自社で可能な事を外部依存した事による不具合をユーザーの負担にするのは、実社会ではモラルハザードと言われかねませんよ。
— emrm37moto (@emrm37moto) August 23, 2019
そしてTwitterモーメントに上がってきたのはAWS障害の文字だった。
Amazon Web Services(AWS)の東京リージョンに障害が発生していますhttps://t.co/5tz4EnYPdR
— Twitter モーメント (@MomentsJapan) August 23, 2019
そう、AWSを使っていたのである。AWSを使っていたアプリの多くが障害でアウトになったのだ。
同じブシロードのゲームでも…
本日発生しておりました通信障害について、現在アプリ内の通信障害が解消されたことを確認いたしました。お詫びとして、本日中に「スター×250」を配布いたします。ご迷惑をおかけいたしましたこと、深くお詫び申し上げます。詳細はお知らせをご確認ください。#バンドリ #ガルパ
— バンドリ! ガールズバンドパーティ! (@bang_dream_gbp) August 23, 2019
一方、同じブシロードのゲームであるラブライブやレヴュースタァライトは通常通りプレイ可能。一体この違いはなんなのか。なんとなく寡占化の悪影響かと思っていたが・・・。
今起きてるAWS大規模障害、AWS側が提示する構成にしておけばサービスに影響はない障害なので、今回サービスが停止しているアプリは金回りやリスクの考え方等が杜撰だってことです。残念ながらそういうサービスの炙り出しになってしまった。
— MAGAWO (@magawo1124) August 23, 2019
ちょっと訂正。AWSのデータベースについては構成しっかりしてても、障害影響のあるサーバから影響のないサーバに切り替わる際にサービスが停止したり遅延したりする可能性はあります。
— MAGAWO (@magawo1124) August 23, 2019
今回起きた障害はAWSの東京リージョンで発生したものだ。
サービスを停止させないには、今回東京リージョンで障害発生している際に、他の場所にあるサーバーへ切り替えできるようにしておけば、防げる問題であったということになる。
そう考えると、同じブシロードのブランドで出ているアプリなのに、レヴュースタァライトやラブライブは稼働し、ガールズバンドパーティが止まったというのが、いったいどういう仕組みになっているのやら。
駅メモに関して言うと、位置登録ゲームはリアルタイム性が非常に大事なもの。今回のAWSの件はサービス事業者側で備えはできたわけである。
そう思うと、先の苦情もわかるものであり、他にも同じような事態に陥ったサービスは、今後の運用改善をしていくことが求められるだろう。