ProxmoxでZFS RAID10とRAIDZ1の検証④ ~復旧テスト編~

前回の続き。SSD*4でストライピングミラーを作り、HDD*5でRAIDZ1(RAID5相当)を作ってみる。耐障害性のテスト。

障害一次回避テスト

VMが使用中のZFSプールがダウンしていると、(OSディスクでなくても)そのVMが起動できないことがわかったので、ディスクをデタッチできるか試す。

デタッチはできるがディスク削除はエラーとなる。コマンドでは可能かもしれない。障害一次回避はせず、まずZFSプール自体を復旧させる必要がある。

致命障害復旧テスト

HDD1.VHDX(RAIDZ1の致命障害分ディスク)を再接続してProxmoxを起動。

VMは起動可能になり、パーティションも利用可能。

許容障害復旧テスト

ZFSプールに新規ディスクとしてSSD5・SSD6・HDD6を追加し、許容障害分のディスクを復旧してみる。

New-VHD  "D:\VHDX\SSD5.vhdx" -SizeBytes 1GB -Fixed
New-VHD  "D:\VHDX\SSD6.vhdx" -SizeBytes 1GB -Fixed
New-VHD  "D:\VHDX\HDD6.vhdx" -SizeBytes 3GB -Fixed
Add-VMHardDiskDrive -VMName "proxmox" -Path D:\VHDX\SSD5.vhdx
Add-VMHardDiskDrive -VMName "proxmox" -Path D:\VHDX\SSD6.vhdx
Add-VMHardDiskDrive -VMName "proxmox" -Path D:\VHDX\HDD6.vhdx
Get-VMHardDiskDrive -VMName proxmox -ControllerType SCSI | Sort Path

欠番のSSD1・SSD4・HDD5が障害状態という想定。

追加したディスクを確認

使用状況がいいえになっている新しいディスクを特定する。

新しいディスクのDiskIDを確認。

# HDD
ls /dev/disk/by-id/ -l | grep sdd
# SSD
ls /dev/disk/by-id/ -l | grep sdh
ls /dev/disk/by-id/ -l | grep sdi

ZFSプール内ディスクを交換

ZFS Replaceコマンドで故障ディスクと新規ディスクを交換する。

# HDD
zpool replace HDD-RAIDZ /dev/disk/by-id/scsi-36002248032089d99762889efecad5d4d-part1 /dev/disk/by-id/scsi-3600224804da59b97b8a55ea0aff99a55
# SSD
zpool replace SSD-RAID10 /dev/disk/by-id/scsi-360022480330855105876edaaf50bf262-part1 /dev/disk/by-id/scsi-360022480160bd4f5fba3380670d11af0
zpool replace SSD-RAID10 /dev/disk/by-id/scsi-36002248015c81e684fe6d51aa86da9dc-part1 /dev/disk/by-id/scsi-360022480d40b48fd1d568dcba3b81cb7

追加されたディスクがオンライン状態になっている。今回は小容量のためすぐ終わったが、大容量ディスクの場合は以下のようなResilverステータスが表示される。

参考サイト Referred website

Thanks for the informative post.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です