丸一日以上止まってて、客のデータも消失だそうな。恐ろしい事である。
携帯電話の番号管理システム*1とかサラ金の自動契約機とか、不審なエラーメッセージがチョロっと出ただけで、これが止まると1時間の売り上げが幾らだから云々!みたいな感じで超怒られるというか調査を急かされるからなー。ましてECサイトとかモロそのまんまお店だしなー。止めたら閉店も同じ。しかも顧客データ消失…当事者だったら夜逃げを考えるレベルだよ。きっと関係者は20日以降残業徹夜続きじゃなかろうか。まぁプロバイダも大変だけど、ユーザの方もこりゃ涙目。恐らく日本のどこかで死人が出る…。
しかしWeb鯖とAP鯖とDB鯖とMail鯖が全部一気に逝くメンテソフトのバグって何だろうな?
VMイメージを定期的にバックアップする仕組みだったけど、壊れたイメージで上書きしちゃった系とか、あとはストレージ丸ごと定期バックアップする仕組みだったけど、壊れたイメージで上書きしちゃったとか、とにかくなにかマズいデータでバックアップを上書きしちゃった系じゃないかと思うんだけど謎。
そもそもデータのバックアップ自体、取ってなかった模様。想像以上にワイルドだった。

↑図中で「バックアップ環境」と称しているのは、普通は「待機系」と呼ばれる代物で、普段動いてる稼動系マシンが壊れた時にすかさず切り替えて使う。これはこれで必要だけど、データ保全目的では無い(ホットスタンバイの待機系だからこそ、何時切り替わっても良いように、同時にセキュリティパッチ当てちゃったんだよね)*2
普通の業務システムだと、上記の稼動/待機構成とは関係無く、消えると困るデータは1日1回差分とか毎週1回全部とか定期的に磁気テープに*3書き出して、金庫にしまっておいたりする。
気合の入ったシステムだと、稼動系と待機系のペアをさらに東京圏と大阪圏に作って同期させて関東大震災に備えたり、更に磁気テープ類は別の地下秘密基地に現金輸送車的な乗り物で搬入して第三次世界大戦に備えたり。そこまでやるのは銀行位だけど。
…けど、まぁ値段によってはこういうワイルドな構成もありなのだろう。安かろう悪かろうで。月々数千円というし仕方ない。

*1:ケータイショップのチャラ男が端末から契約処理に使うのよ

*2:しかしそれもそれで如何なものかと思うけど。…普通は、同時と言いつつも実際は片方ずつだよな…片方に当てて、異常無しで、じゃもう片方に当てると。一気に両方はこれまたかなりワイルド。事前に、トラブった時の切り戻し手順を考える筈だからその時に気付きそうなものだけど…。

*3:最近はハードディスク容量も大きくなってきたので小規模だったらディスクに取る事も