backstage

合唱音源の新着情報の舞台裏

2018年1月のAzure VM メンテナンスは結局どうなったのか

3行まとめ

※2018年1月4日時点の情報

  • 任意のタイミングで再起動するセルフサービス期間は2017年12月28日 午前9時00分に開始し、2018年1月4日 8時30分に終了した
    • これは、開始日も終了日も当初の予定より約5日前倒しされた
  • 以降は予定メンテナンス期間となり、仮想マシンは順次自動で強制再起動されることになった

概要

2017年末から2018年始にかけて、Microsoft Azure 仮想マシン(AzureVM) の再起動が必要なメンテナンスが発表されました。 このメンテナンス期間が延びたり縮んだりして興味深かったので、どういう結果どうなったのかまとめておきます。

仮想マシン冗長化しておいて、再起動してもダウンタイムが無いような構成で組んでおくべきなのですが、なかなかそう理想ばかりで世の中は回りません。 私が個人で運用している合唱音源の新着情報.comは非商用だから良いものの、単一構成のWebサーバなのでVMを再起動されたタイミングでサービスダウンタイムが発生してしまいました。 このようなサーバを運用している場合、メンテナンスによっていつ再起動がかかるのかは重要な問題になります。

なお「セルフサービス期間」とは自由なタイミングで再起動をしてメンテナンスを終わらせることができる期間を指します。対して「予定メンテナンス期間」とは、強制的に再起動が発生する期間のことです。

時系列順の情報まとめ

[2017-12-20] 仮想マシンのメンテナンスとセルフサービス期間が発表

[告知] 2018 年 1 月 2 日より Azure IaaS 仮想マシンのメンテナンス期間が開始します – Japan Azure Technical Support Engineers' Blog (12月20日時点)より引用

2018 年 1 月 9 日から Azure プラットフォームのホスト メンテナンスが予定されており、これによってお客様の仮想マシンが再起動されます。 セルフ サービス期間の通知については、後日送付される正式な通知をご参照ください。現時点では、セルフサービス期間は 2018 年 1 月 2 日から 1 月 9 日となる予定です。

セルフサービス期間については未確定ですが2018年1月2日から1月9日までの予定と告知されました。 この時点で「1月9日まであるなら、正月明けの4日とか5日の営業開始後に対応すれば間に合うか」と判断した人もいたのではないでしょうか。

この当時の参考文献: Azure Virtual Machines (IaaS) の計画メンテナンス (来年1/2以降) (追記: 12/28以降に変更)satonaoki.wordpress.com

[2017-12-27] セルフサービス期間の延長が発表

[告知] 2018 年 1 月 2 日より Azure IaaS 仮想マシンのメンテナンス期間が開始します – Japan Azure Technical Support Engineers' Blog (12月27日追記時点)より引用

Azureデータセンターにてセルフサービス期間をなるべく長く用意させていただくべく、尽力させていただきました結果、セルフサービス期間は日本時間の12/28 午前 9 時より開始し、予定通り 1/9 午後 9:00 までを設けさせていただくこととなりました。

セルフサービス期間は 5日前倒しされて、 2017年12月28日 午前9時00分~2018年1月9日 午後9時00分になりました。 年始休暇が長い会社の場合も、年末ギリギリに対応できるようなスケジュールになりました。

なおメールでは翌日12月28日14時13分(つまりセルフサービス期間開始後)に「[お知らせ]: Azure プラットフォームにメンテナンスが予定されており仮想マシンに影響が生じます」というタイトルで届きました。 しかし1月10日から予定メンテナンスによる再起動が発生する事のみが記されており、セルフサービス期間に関する記述は説明はありませんでした。

この当時の参考文献: Azure Virtual Machines の計画メンテナンスbuchizo.wordpress.com

[2018-01-04] セルフサービス期間が急遽終了し、強制再起動を前倒し実施

CPU の脆弱性から Azure のお客様を保護するために – Japan Azure Technical Support Engineers' Blog より引用

2018 年 1 月 3 日 3:30 PM (太平洋標準時) すなわち 1 月 4 日 8:30 AM (日本時間)より、再起動が必要な仮想マシンは順次再起動を行ってメンテナンスを完了させてまいります。今回の更新の緊急性に伴い、本時刻をもって、一部のお客様でご利用可能となっていたセルフサービスのメンテナンス ウィンドウは終了となります。

ここで、今回のメンテナンスにはGoogle Security Blogに記載されているCPU脆弱性の対策が含まれることが公表されました。おそらく本件の緊急性の高さを踏まえて、セルフサービス期間が5日前倒しの1月4日に終了することになりました。

正確な時刻は不明ですが、このMicrosoftJapanのブログは1月4日未明にはすでに公開されていたようです。セルフサービス期間の終了まで残り数時間というギリギリのタイミングですが、一応これが事前の告知となりました。

一方メールでは「CPU 脆弱性対策の為にメンテナンスの実施を前倒し致します。」というタイトルで、本件を通知する1月4日14時16分に届いていました。 これはセルフサービス期間の終了後であり、私のサーバはすでに再起動が実施された後でした。 なおメールの内容はブログとほぼ同じでした。

この当時の参考文献: www.publickey1.jp

結論

  • Japan Azure Technical Support Engineers' Blog は早くて正確
    • メールでの通知よりもブログの方が早い
  • VirtualMachineは冗長化するべき
  • メンテナンス予定は変更されるかもしれないので、後回しにするべきではない
    • 早くメンテナンスをして、早く恩恵を受けられるようにするべき