「RAID」カテゴリーアーカイブ

AMD RAIDXpert upgrade

どうも本番機サーバの調子がおかしい。週に1回はフリーズしてしまう。原因は決まってメモリ不足。8GBも積んでいて、Vista Home Premium x64なのに。。。 VMファイルのコピーバックアップとディスクメンテを止めてみたら良くなったけど、それでも今週1回フリーズしてるし。

そこでとりあえずBIOSとAMD RAIDXpertの更新をしてみた。マザーはGA-MA78GM-S2Hだから@BIOSでWindows上から簡単に更新。RAIDXpertもAMDサイトから最新版をダウンロードして、一旦現状のものを案インストールしてからインストール。バージョンが2.4.1540.8から2.4.1540.11に上がった。ちなみに、設定はすべてリセットされてしまうので要注意。

RAIDXpertはほんのわずかな更新のように思えたけど、メール通知設定が大幅に増えている。以前は何を設定してもメールが来ることはなかったけど、これで何かが改善されたかな?

AMD RAIDXpertで再構成(2)

またしてもRAIDXpertでRAID1の再構成を行ったのだけど。。。

前回と同様、片肺のRAID1に対してスペアドライブを接続して、前回と同様、Windowsを起動してAMD RAIDXpertにアクセスする。そして新たに加わったJBODを削除して。。。

とここで、いきなり「”RAID1 ARRAY 1″ の再構築が開始されました」と表示された!! あれ~ と思って論理ドライブを確認すると確かに2つのドライブが設定されている。

確かに「スペアドライブ」ではあるけど、今回は一時的にRAID1を崩して、同じペアのドライブを再構成しているので、もしかするとRAIDXpertが前のディスクを覚えていたのかもしれない。でも、前回もスペアドライブの指定をしなくても、自動で再構成を行っていたのかもしれない。それ以上に、新たなドライブを接続したときに「RAID READY」とかに設定すれば自動で再構成するのかも。。。 そもそも、「RAID READY」ってなんだ?

謎の多いRAIDXpertである。

AMD RAIDXpertで再構成

再構成の前に説明が必要だけど、そもそも使っているマザボがAMD CPU用のGA-MA78GM-S2H(South BridgeはAMDのSB700)で、チップセットのRAID機能を使ってRAID 1を組んでいる。

で、とある事情でRAIDを一時的に片肺にする必要があって、そしてその次に再構成を行った。まあ、RAIDの再構成はこれまで五万とやってきているので、さして気に留めていなかったけど、AMD SB700のチップセットRAIDの再構成はちょっと変わってて戸惑った。ググってもあまりいい例がなかったからここでまとめてみよう。

まず、素直に思うのがBIOSのRAIDセットアップ画面でさくっと再構成・・・ なんだけど、いつもの見慣れたRebuild Arrayのメニューがない。Promiseのマニュアルを見よ、なんてメッセージがでるところをみるとこのRAID、Promise製のものをアレンジしたものらしい。であればなお更Rebuild Arrayがないのがおかしい。RAID arrayをひとまず解消してから組み直すのか、と思ったけど、Delete Arrayを行うと「データがなくなる・・・」みたいなメッセージが表示され、ビビる。

なーんとなく、質素なRAIDセットアップ画面を見ていると、ここでは再構築できなさそうだと感じた。いや、もしかしたら出来るのかもしれない。とある掲示板では再構成用HDDを接続すれば勝手にバックグラウンドで再構成が始まる、なんて書いてあったけど、それはどうもなさそう。で、結論としては、結局はWindowsを立ち上げて、RAIDXpertで再構成をするわけ。

このマシンの構成としては、2組のRAID 1と1台のバックアップ専用HDDがあるけど、全部同じHDDにしている。よって5台も同じHDDを接続しているのだけど、どれがどの役割のドライブだかすぐ分からなくなる。再構成用ドライブを接続していない状態でのRAIDXpertの表示を覚えておいて、再構成用ドライブを接続した後で増えているドライブを探し出す必要がある。いや、RAIDXpertではHDDのシリアル番号が分かるから、Windows上でそれが確認できれば事足りるんだけど。たぶんそんなツールがあると思う。

で、RAIDXpert上で再構成用ドライブが確認できたら、そのドライブはJBOD on port… として認識されていると思う。まず、これを削除する。そうするとスペアドライブとしてそのドライブを登録できるようになるので、再構成を行うRAID arrayを指定してスペアドライブとして登録する。グローバル(だったか・・・)スペアとしても登録できるようで、これはどのarrayが必要になったときにでも使える汎用スペアとして使えるのかもしれない。これは未検証。

スペアが登録できれば、論理ドライブで再構成するarrayを選択すれば「再構成」タブが有効になって、無事再構成が始まる。まあ、今回はこれで乗り切れたけど、結局はWindowsがないと再構成ができない、ってことになっちゃう。本当かな? 他社製マザーもそうなのかな?

LVMパーティションの拡張

ようやくLVMパーティションの拡張に成功した! とりあえず2日運用してみて全く問題は発生していない。

ということで、その顛末をまとめてみたんだけど、ブログエントリにするには分量が多いので研究室のコンテンツとしてアップしたので、LVMパーティションの拡張を見てください。

やれやれ、これでARAID99-2000も末永く使っていけるようになったな。

Filesystem、実は大丈夫

昨日のように、長いこと不具合無く動いているサーバのfilesystemが実はズタズタボロボロ・・・なわけは無いだろう、と思ってよ〜〜〜く考えてみた。

そもそもFedoraはLVMを導入しているから、/dev/sda2とパーティションを指定していても、実際はVolGroup00と言うvolume group (VG) に属するLogVol00とLogVol01というlogical volume (LV) が存在するわけだ。LVが従来のパーティションと言う位置づけになる。そうすると、filesystemはLVに存在するはずだから、いきなり# e2fsck -f /dev/sda2とやってもうまくいかないだろう、と。

そこで、LVを指定して、# e2fsck -f /dev/mapper/VolGroup00-LogVol00とやってみたら・・・
なんと、1つもエラーがでることもなく、ものの数分で終了。うまくいくじゃないですか。よって、本番機のfilesystemはいたって正常だったわけだ。

だいぶLVMの勉強が進んできて、なんとなくパーティションの拡張が出来たような状態まで漕ぎ着けることができた。まだ出来上がったHDDでシステムを起動していないからなんとも言えないけど、今のところ順調にきている。うまくいったらその方法とともに報告することにしよう。

Filesystemが危険な状態に・・・

パーティションを拡張しようとここ2、3日かかりっきりだけど、もういやというほどe2fsckしている。パーティションの拡張作業中だから・・・とさほど気に掛けていなかったけど、とっても長い時間掛かるし、見たことのないエラーがわらわらと出力される。

ふと、これはファイルシステムが壊れ掛かっているからパーティション拡張作業が難航しているんじゃないか? e2fsckが延々と掛かるのではないか? と思うようになった。

試しに、本番ディスクのミラーを取り出して、別のマシンに接続してRescue CDで立ち上げてみた。こういうときにARAID99-2000は威力を発揮するな。まず最初に# e2fsck -f /dev/sda2としてみたら、group descriptorがおかしいとか、superblockのジャーナルがおかしいとか言われる。これはfilesystemが相当怪しそうだ。とりあえず# mke2fs -S /dev/sda2としてsuperblockとgroup descriptorの修復を行ってみる。そうするとinodeのresizeが無効だ、みたいなことを言われるけど正面突破してe2fsckしてみる。そしたらワラワラとエラーがでてくるじゃありませんか。

もうすでに2時間は経過している。これは明日の朝まで放っておくしかないかな。それにしても早く手を打たないと、filesystemがぶっ壊れるのは時間の問題だ!

RAIDパーティションの拡張 − その2

前回はちょっとした調査だけで終わってしまったけど、250GBもある容量のうち120GBしか使っていないのはあまりにももったいないから、RAIDパーティションの拡張に挑戦してみた。

前回はpartedが使えそうだということと、partedが実行されるLinuxが存在するパーティションについては適用できない、と言うことが分かった。

で、まずGNU Parted専用のブートディスクを作成するにはに見習ってparted専用ブートフロッピーを作ってみた。というか、作ろうとした。けど、partedのブートイメージのダウンロードサイトに行っても2枚目のブートフロッピーのイメージが見当たらない。適当なファイルをフロッピーに展開してみたけどだめだった。
続きを読む RAIDパーティションの拡張 − その2

RAIDパーティションの拡張

最近どんな岩石よりも硬く安定している我が家のサーバ(なんちゅー比喩)。何が功を奏したのか分からないところが腑に落ちないけど、安定していると言うことはいいことだ。熱暴走対策(ケースに穴を開けてファンを増設)、ARAID99-2000のファームアップ、余計なプロセスの停止・・・ と、いろいろと手を打ってきたけど、結局は不安定なパッケージをupdateしてしまったんじゃないかと思っている。

FC3のupdateを行う際にローカルでテストしてからサーバにupdateする、なんて面倒くさい手順を踏めばいいのだろうけど、今回みたいに症状が出るのにある程度の時間がかかる場合はとてもやっかいだね。それよりもupdateしないリスクのほうが高いからupdateをやめるわけにもいかないし。

さてさて、この騒動のさなか、120GBだったディスク容量がいつの間にか250GBにアップしたんだけど、RAIDで認識される容量は依然として120GBのまま。これは不具合でもなんでもないんだけど、どうせなら250GBすべてを使いたくなるもの。

Linuxにはpartedというパーティション管理ユーティリティがあるものの、使ったことがない上に、RAIDパーティションについても使えるのかは分からない。一応、ARAID99-2000のマニュアルにこのような場合は

  1. ミラーリングを解除して、シングルドライブとして起動する。
  2. パーティション変更ツールでパーティションの容量を変更する(120GB -> 250GB)。
  3. 解除したドライブを戻して再構成する

と言う手順をふむといいらしい。

でもまあ、とりあえずpartedを起動して、パーティション情報を確認してみる。(parted) print
/dev/sdaの Disk geometry: 0.000-238475.179 メガバイト
ディスクラベルの種類: msdos
マイナー 開始 終了 種類 ファイルシステム フラグ
1 0.031 101.975 プライマリ ext3 boot
2 101.975 114470.969 プライマリ ext3 lvm
となっているから、一応250GBは認識しているようだ。

ただ、partedはOSがmountしていない領域にしか使えないようだから、parted起動専用ディスクを作成するらしい。これはまた後日、だな。

ARAID99-2000のファームアップ

とりあえず昨日までの状態は、
Primary : なし
Secondary : ST3250823AS
の片肺運転。ちゃんとしたバックアップを取っていないから、いつまでもこの状態を続けるわけにもいかない。しかたないからもう一台ST3250823ASを買ってきてRAID 1 を再構成しようと思ったら。。。 OFF → FAILになってしまう。まずい、予想通り再構成に失敗するじゃん。。。

やはりここで言っていることが正しいのかもしれない。これから出てくるS-ATA IIドライブを使っていくにはファームアップの試練を乗り越えないといけないのかもしれない。。。
続きを読む ARAID99-2000のファームアップ

HDDが2台同時に壊れる?

前回やっと原因がつかめたと思ったけど、どうやらそうは簡単に問屋は卸してくれないみたい。というのも、新しいドライブ、Barracuda 7200.8 ST3250823AS (250GB) を買ってRAID 1(ARAID99-2000)の再構成が出来たところまでは良かった。ひとまず新しいドライブにデータをコピーできて一安心。

この状態では
Primary : 旧ドライブの生きていると思われるドライブ – ST3120026AS (120GB)
Secondary : 新ドライブ – ST3250823AS (250GB)
となっている。

しばらくするとカッコンカッコン音がするので見てみると、Primaryのほうの動きが怪しい。と思ったらサーバが死んだ。。。
続きを読む HDDが2台同時に壊れる?