丸一日以上止まってて、客のデータも消失だそうな。恐ろしい事である。
携帯電話の番号管理システム*1とかサラ金の自動契約機とか、不審なエラーメッセージがチョロっと出ただけで、これが止まると1時間の売り上げが幾らだから云々!みたいな感じで超怒られるというか調査を急かされるからなー。ましてECサイトとかモロそのまんまお店だしなー。止めたら閉店も同じ。しかも顧客データ消失…当事者だったら夜逃げを考えるレベルだよ。きっと関係者は20日以降残業徹夜続きじゃなかろうか。まぁプロバイダも大変だけど、ユーザの方もこりゃ涙目。恐らく日本のどこかで死人が出る…。
しかしWeb鯖とAP鯖とDB鯖とMail鯖が全部一気に逝くメンテソフトのバグって何だろうな?
VMイメージを定期的にバックアップする仕組みだったけど、壊れたイメージで上書きしちゃった系とか、あとはストレージ丸ごと定期バックアップする仕組みだったけど、壊れたイメージで上書きしちゃったとか、とにかくなにかマズいデータでバックアップを上書きしちゃった系じゃないかと思うんだけど謎。
→そもそもデータのバックアップ自体、取ってなかった模様。想像以上にワイルドだった。
↑図中で「バックアップ環境」と称しているのは、普通は「待機系」と呼ばれる代物で、普段動いてる稼動系マシンが壊れた時にすかさず切り替えて使う。これはこれで必要だけど、データ保全目的では無い(ホットスタンバイの待機系だからこそ、何時切り替わっても良いように、同時にセキュリティパッチ当てちゃったんだよね)*2。
普通の業務システムだと、上記の稼動/待機構成とは関係無く、消えると困るデータは1日1回差分とか毎週1回全部とか定期的に磁気テープに*3書き出して、金庫にしまっておいたりする。
気合の入ったシステムだと、稼動系と待機系のペアをさらに東京圏と大阪圏に作って同期させて関東大震災に備えたり、更に磁気テープ類は別の地下秘密基地に現金輸送車的な乗り物で搬入して第三次世界大戦に備えたり。そこまでやるのは銀行位だけど。
…けど、まぁ値段によってはこういうワイルドな構成もありなのだろう。安かろう悪かろうで。月々数千円というし仕方ない。
コメント