RAIDを使って耐障害性を上げる

2011年7月19日(火)
sanonosa

RAIDアレイ障害時の対処方法

実際にRAID構築を行って運用してみると、ハードディスク障害がたまに発生します。そんなときに慌てないためにもここでRAIDアレイ障害時の対処方法についても記してみたいと思います。

1. 現在のRAIDアレイの状況を確認する

# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdb1[2](F) hdc1[1]    <- hdbに(F)が付いていると壊れている
      312568576 blocks [2/1] [_U]

unused devices: <none>

2. 壊れたハードディスクにFailマークを付けてから切り離す

# mdadm --fail /dev/md0 /dev/hdb1           <- Failマークが付いていなければFaliマークを付ける
  mdadm: set /dev/hdb1 faulty in /dev/md0

# mdadm --manage /dev/md0 --remove /dev/hdb1    <- remove、つまりRAIDから切り離す
  mdadm: hot removed /dev/hdb1

# cat /proc/mdstat <- 確認
Personalities : [raid1]
md0 : active raid1 hdc1[0] ← RAIDデバイス(/dev/md0)を構成する/dev/hdb1が切り離されたことがわかる
      312568576 blocks [2/1] [_U]

3. 新しいハードディスクを入れ替えてからパーティションを生成する

前ページの「2. fdiskでパーティションを生成する」を参照してください。

4. RAIDアレイに新しいハードディスクを追加する

# mdadm --manage /dev/md0 --add /dev/hdb1

5. RAID再構築状況を確認する

# cat /proc/mdstat

Personalities : [raid1]
md0 : active raid1 hdb1[0] hdc1[2] 
      10241344 blocks [2/2] [UU]
      [======>..............]  resync = 30.2% (3097024/10241344) finish=105.4min speed=112
      7K/sec

unused devices: <none>

というような手順となります。RAIDアレイ障害の対処自体はそんなに難しくありませんが、念のため実運用の前に何度か練習してみると良いでしょう。

図2:RAID障害復旧手順

最後に

RAIDの構築から復旧まで一通りの手順を知らない、もしくは知っているが経験がないという方は結構多いと思うため、今回簡単ではありますが手順を一通りご紹介してみました。

RAID構成を組むという機会はそうそうないため、ハードディスク障害やハードディスク増設等の機会でRAID構成に変更が必要な場合、大抵手順や当時の設定内容を忘れています。そこでこの手の作業をする際はこまめなメモを取っておく習慣にしておくといざというとき安心ですので強くおすすめしたいと思います。

国内某有名ITベンチャー企業に創業メンバーとして携わる。国内最大規模のシステムを構築運用してきたほか、社内情報システム導入のプロジェクトマネジメント、韓国の交友関係が豊富なことから韓国関連で多数のシステムインテグレーションなども行ってきた。前職は富士通株式会社でSE。
個人blog:http://nosa.cocolog-nifty.com/

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています