[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
VMware ESXiが固まった日1
サーバーを更改してからまだ半年も経っていない。
しかも今回のサーバー更改で初めてVMwareの仮想技術を導入したのだ。
サーバーの動きを一つ一つクライアントで確認していく。
実はリモートで仮想サーバーに接続できなくなっている。接続できないけど稼働している仮想サーバーもあれば、固まっていると思われる仮想サーバーもある。
vSfpere Clientから状態を確認してもアラームなど問題はなさそうなのだが・・・。
「ADは大丈夫。グループウェアも動いている。おかしいのはファイル、プリントサーバーだな。」
固まっているのは、ファイルサーバーとプリントサーバーを兼ねている一つの仮想サーバー。
「とりあえず再起動しますね。」
vSphere ClientからvSphereServerに接続し、該当のサーバーの再起動を選択。タスクで再起動命令を送ったとなるが・・・・・。タイムアウト。再起動に失敗したようだ。
「じゃぁ、仮想サーバーの電源OFF」
仮想サーバーといえども、一応電源OFFと同じ働きをするものがある。物理サーバーでいう電源ボタンだ。
順調に行った?と思った矢先、95%で動かなくなってしまった。
「固まったか?」
30分後、エラーメッセージが返ってきた。「ESXiから不明なエラーを検知しました」
不明なエラーとはなんだ・・・・。
「ここまできたらESXiのホストサーバーのシャットダウンしかないなぁ・・・」
「どうだぁ、まだ復旧できないのか?」
と上司がやってきた。
「まだです。てこずっています。」
「ベンダーは?」
「来るてはずになっていますが、時間がかかるそうです。」
とにかくこっちで対応するしかない。
「サーバーのボタン、長押しちゃえよ。」
「いや、それは・・・・。最後の手段です。もう少し待ってください。」
上司はまだ複数台の物理サーバーで運用していた感覚でいるのだ。
今回のサーバー更改でESXiホストを2台とし、その上に仮想サーバー10台稼働させている。
まだまだ余裕のある構成だ。
そのうちの一台のESXiサーバーを再起動の準備として、稼働している仮想サーバーをシャットダウンしようとするが、応答がない。電源OFF命令もきかない。応答が無くなったファイル・プリントサーバーと同じだ。
タスク上は電源OFF命令の実行中だが、時間がない。始業から1時間以上経っている。
「ESXの電源OFFを投げます。」
vSpere Clientから問題のESXiに対し電源OFF命令を実行する。
タスクでは、「電源OFF命令実行しました」で完了マークが出る。
「うまく行ったか?」
コンソール画面を切り替えてESXiを表示する。
変化がない。
手がなくなった・・・・。
ESXiから直接コマンドを投げることもできるのだろうが、コマンドを知らなかった。
GUIで慣れてしまった自分が情けない・・・。
「最終手段ですね。」
問題のESXiの物理サーバーの電源を長押して、強制OFFを実施した・・・。
ヒュン・・・とサーバーのファンが止まり、別のサーバーのファンの音がひびく。
「お?戻ったぞ」
と上司。どうやらファイルサーバーの共有フォルダが開けたらしい。
VMWareご自慢のHigh Availabilityがやっと効いたか。
問題のESXiの電源をOFFにしたことによって、そこで展開していた仮想サーバーがもう一台のESXiに移動して再起動したのだ。
「とりえあえずこれで様子見ましょう。」
飛行機でいう片肺飛行だがしかたがない。
とりあえず一息ついたところで、システム構築したベンダーの担当者がやってきた。
「すいません。遅くなりました。」
つづく
Amazon
PR
ソフト関連
メーカー直販PC
周辺機器
ランキング
プロフィール
しかしながらあまりの激務に退職。もうシステム系はいやだと思っていたが、ひょんなことから企業の電算室に勤務することとなる。