Tsukiji Systems
RSS1.0


googleで
サイト内検索
このブログ
を検索!
  help

巻き戻し中。

2011年
2月
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28


2011-02-05(土) 保守 [長年日記]

_ PC HDD

明け方のdaily backupの際に、SMARTエラーでアラートが出た。

dmesgしたら、ataコマンドでボロボロとエラーが出てる。

どうやら/varのエリアで障害がある模様。

今のところ、/varにあるメールやログも影響は無いようだし、慌てずにPC工房で160GBを調達。

_ PC ダウンタイム

複製運用しているセカンダリを昇格させるのはちょっと面白くない。

/homeや/varは前日、それ以外は1週間前のデータ。*1

買ってきたHDDになるべく新しいデータを吸い上げて復旧させたい。

かつ、ダウンタイムは極小に。

USB変換から直接サーバに繋いで事を始めると、どこかで再起動になりそうな気がする。

そうなると、この手のディスク障害はそこでトドメを刺してしまうことが経験上ほとんど。*2

だから、なるべく再起動とかしないうちにコソッとデータを吸い上げるのだw

なので、まずは

1.母艦のVMwareの実験用FreeBSDに、買ってきたHDDをUSB変換して接続、RawDeviceでマウント。

2.インストールDVD起動/sysinstallでPartition作成。「/」はPartitionEditorの「S」で起動フラグ付けるの忘れずに。

3.VMwareで通常起動、それぞれ仮の場所にマウント。

4.次に、鯖から実験用VMにコマンドでrsh出来るようにVM側の/etcのpam.d/rshを変更。*3

5.鯖にログインしてこんな感じで転送

*1 ソフトウエアミラーも出来るのだけど、人間が「やっちまった」リカバーにはミラーだと無意味なので(実際こっちの方が多い)こうしている。

*2 辛うじて動いてるんだから、再起動とか死亡フラグw

*3 シェルで入れてもコマンドは認証無しで飛ばなかったりするから要注意w

cd /[コピー元]; tar -z -W one-file-system -cf - . | rsh [ターゲットホスト] -l root 'cd /[コピー先のマウントポイント];tar xfp -'

_ でリモートにコピー。

_ PC 但し

/varはとりあえず1日前のバックアップを転送してから、サルベージ可能な最新版を上書きする方向で・・・

ここまで出来れば、サーバーの停止時間はHDD入れ替え&起動の3分程度のはず。



アクセスカウンター!
累計:
本日:
昨日:
最近のツッコミ

(´・ω・`)ショボーン