ご迷惑をおかけしております。本日の昼頃、ドコモ端末のアクセス障害はDoレジ(ファーストサーバ社)に対応いただき完全復旧いたしました。本来のURLへのガイドも出させて頂いております。ご対応頂ければ幸いですm(_ _)m

いや、しかし参りました。。
朝まで少ない情報の中で原因を追及しながら旧アドレスを復帰させたり、朝からはDoレジ側に沢山電話したりしました。技術担当者まで行き着くのに時間がかかりましたが、行った復旧方法が正当なものでしたので、完全復旧とさせて頂きました。

この度は誠に申し訳ございませんでした。同じようなことがないよう、他社に頼らない独自のシステムに切り替えていこうと思います(ちょっと時間がかかりそうですが…)。

また、詳しい事の顛末を書きました。興味ある方は以下ご確認ください。


●1月14日の21時からDoレジ側でネームサーバのIPアドレス変更のメンテナンスを実施していた。
●ネームサーバ(NS)のIPアドレスの変更なので、そのネームサーバ自体の名前引きのTTLを事前に短くして、数十分稼働させた後旧サーバは落としていた(もしくは正常に問い合わせを返さない設定になっていた)。
●TTLを額面通り受け取るDNSは目論見通り切り替えに成功したが、ドコモをはじめとする一部プロバイダでNSの名前解決が出来ない状況になっていた(古いNSに問い合わせに行っていた→504表示)。
●私からの報告により現象を察知して、旧ネームサーバを復帰(もしくは正常に応答する設定に変更)した(本日の昼頃)。
●旧NSへ問い合わせを行っているドコモ内名前解決システムが正常稼働した。

恐らくドコモ内のシステムでは、パフォーマンスを優先するためにNSの名前解決結果を静的に保持しているのですね。。感想としては、

●TTLを額面通り扱うのがどれだけ危険か、というのは最早常識なので、今回のDoレジ側の工事は計画段階から失敗していたのだと思います。
●世界最大のISPであるドコモに対して「一部のプロバイダ」扱いするのはどうかと思います。
●問い合わせの中で「止まらないように新旧サーバ同時に動かしているからそのようなことは無い」とのことでしたが、それは嘘すぎます。。
●はじめから正解をトクトクと語っているのに、なぜ信じようとしないのか。。私以外の問い合わせにはそうやって誤魔化していたのでしょうか。。
●というかNSのIPアドレスの変更とか、普通しないでしょう。。
●最終的には技術責任者が出てきてくれましたが、そこまで多くの時間を費やし、しかも「正常稼働している」の一点張りはさすがにどうかと思いました。早い段階から動いていない現実を認め、素早く対処して頂きたかったです。
●インターネットは「動いているものが正しい」という文化です。いくら教科書通り進めて「僕は正しいことをした」といっても意味はないと思います。特にDNSは世界最大の分散ネットワークです。明らかに慎重さを欠いたメンテナンスだったと思います。

言いたいことはまだまだありますが、この辺で。。
技術責任者の方とお話して、

●旧サーバは1月末までこのままにしておく。
●旧サーバを落とすときは問い合わせが発生していないか確認し、慎重に対応する。
●障害報告を出す。

とお約束頂きましたので、完全復旧とさせて頂いております。