日記+コメント付きブックマーク+他人にも役に立つかもしれない情報など。
(更新情報: RSS(ツッコミ付き) / RSS(ツッコミ抜き) / LIRS)
- p (01/03)
- Thiramil (10/26)
- 久々にいまむらを食べたい通りすがり (09/28)
- Fluxadir (05/16)
- Antiprestin (11/08)
2012/07/19
_ [システム運用] BBU 付き RAID コントローラの載ったサーバを買っても有効化されているとは限らない
要旨 → サーバ機器を買うと (少なくとも富士通は) RAID コントローラのキャッシュが無効化された設定で納品される可能性があるので、納品後設定を確認し有効化するように気をつけた方が良い。
去年 PRIMERGY RX200 S6 にバッテリバックアップユニット (BBU) 付き RAID コントローラのオプションをつけて買ったのだけど、いざ使ってみようとして RAID 管理ツールを開いてみたところ、コントローラに搭載されている書き込みキャッシュが納品時は無効化されていることに気づいた。
PRIMERGY(プライマジー) アレイコントローラの機能と設定および操作によると、
出荷時に構成されているアレイおよび、新規に構築したアレイは、Write Through (ライトスルー) の設定となっています。
(中略)
一般的に、予期しない電源断等の異常動作が発生した場合、WriteBack および Always Write Back 設定では、書き込みキャッシュ内の書き込み未完了データが失われる危険性があります。必ず、アレイコントローラの取扱説明書に記載の動作概要を理解した上で、取扱説明書に従って設定を行ってください。
[PRIMERGY(プライマジー) アレイコントローラの機能と設定および操作より引用]
となっており、BBU や UPS がない場合は書き込みデータ損失の恐れがあるので書き込みキャッシュはデフォルトでは無効化してあるよ、必要に応じて有効化してね、と書かれている。それはわかる。BBU がないのであれば。
しかし、続けて
アレイコントローラにバッテリバックアップユニットを搭載すると、上記のようなトラブルの際、キャッシュメモリ内の書き込みデータを保護することができます。また、UPS や冗長電源によってサーバ本体の信頼性を向上させる事も、書き込みデータの信頼性の向上に繋がります。
[PRIMERGY(プライマジー) アレイコントローラの機能と設定および操作より引用]
と、BBU を搭載してれば書き込みキャッシュ使っても大丈夫だよ、と書いているのにも関わらず、BBU 搭載モデルまでなぜかキャッシュを無効化した状態で出荷している。
そもそも書き込みキャッシュを使ってもデータ消失の可能性を防ぐために (BBU 非搭載版もある中わざわざ追加費用払って) BBU 搭載型の RAID コントローラを選んでいるのであって、BBU を搭載しているのに書き込みキャッシュを有効化しないのは無駄金を払っていることに等しい。
ところで、この PRIMERGY に搭載されている RAID コントローラにはどのようなキャッシュ設定の選択肢があるのだろうか。
論理ドライブ作成画面を見てみると、下記3つの選択肢がある。
- データ保護を重視(デフォルト)
- 性能を重視
- カスタマイズする
ここでデフォルトの「データ保護を重視」を選んだ場合、
ライトモード: ライトスルー
リードモード: Read-ahead(先読み)
キャッシュモード: ダイレクト
ディスクキャッシュモード: 無効
となる。
「性能を重視」を選んだ場合は、
ライトモード: 常時ライトバック(BBUの状態に依存しない)
リードモード: Read-ahead(先読み)
キャッシュモード: ダイレクト
ディスクキャッシュモード: 有効
となる。
各設定項目は個別に変更可能で、下記の選択肢がある。
- ライトモード
- ・ライトバック
- ・常時ライトバック(BBUの状態に依存しない)
- ・ライトスルー
- リードモード
- ・自動適応
- ・Read-ahead(先読み)
- ・read-ahead(先読み)無し
- キャッシュモード
- ・キャッシュ有り
- ・ダイレクト
- ディスクキャッシュモード
- ・有効
- ・無効
ライトモード以外については詳しいドキュメントがなく、それぞれ何を意味するのかはっきりわからないので今回は無視するとして、問題はライトモードだ。
ライトバックは BBU 有効時のみ書き込みキャッシュ有効、
常時ライトバックは BBU の状態に関わらず書き込みキャッシュ有効、
ライトスルーは BBU の状態に関わらず書き込みキャッシュ無効なわけだが、
この中で多くのユーザにとって最も望ましいのは「ライトスルー」でも「常時ライトバック」でもなく「ライトバック」だろう。
BBU が有効な場合、不意の停電へのリスクを負うことなく高いパフォーマンスを得られ、BBU 非搭載時やバッテリ劣化時は自動的にライトスルーに切り替わるのだから、データ損失のリスクはない。(ただしバッテリ劣化時に本当に切り替わるのかどうかドキュメントに明記されていないので想定と異なる可能性はある)
BBU 付き RAID コントローラを載せた PRIMERGY を買った場合には、納品時構築済みの、または自ら新規に作成した論理ドライブについて、RAID 管理ツールでキャッシュモードを「ライトバック」に変更しなければ本来のパフォーマンスを享受できないので、注意が必要である。
そもそもこの富士通のデフォルト設定がおかしい。
上にも書いたように、そもそもユーザは書き込みキャッシュを安全に使うために わざわざ高価な BBU 搭載型の RAID コントローラを選んでいるのに、せっかくつけた BBU が全く活かされない状態で出荷しているのである。これでは何のための BBU なのかわからない。
富士通的には「お客様のデータの安全性を重視して」というスタンスなのかもしれないが、BBU を使える状況下でキャッシュを有効化すると安全性が損なわれるケースとは何なのか? もしライトバックモードに何らかの既知の欠陥があり、BBU を搭載していてもデータ損失の危険性があるのでお薦めできないということであれば、そのリスクをきちんと説明すべきではないか。
また、どうしてもその状態で出荷したいなら、「本サーバは BBU 付きモデルですが、念のため初期状態では無効としてあります、BBU を活用するためには…」という説明を「はじめにお読みください」的な目立つ資料として同梱すべきだし、論理ドライブ作成時のテンプレも、「データ保護を重視(常時ライトバック)」「性能を重視(ライトスルー)」どちらもナンセンスなので、「バランス(ライトバック)」を設けて、それをデフォルトとすべきではないか。
ちなみに、この BBU 付き PRIMERGY は、購入後富士通の SE にシステム構築してもらったのだが、「デフォルトでは BBU が使われない低速設定になっていますが、有効化しますか?」というようなヒアリングはなかった。富士通自身の SE ですら、このデフォルト設定について把握していないということなのだろう。
現在のデフォルト設定は富士通の SE ですら把握していない設定上の問題をエンドユーザが認識・判断することを求めている状況なので、世界中の PRIMERGY に内蔵されている BBU は大半が無用の長物化しているのではないだろうか。勿体ないことだ。
貴重なご意見を拝見しました。<br>元メーカー関係で働いていた者です。<br>まったく、おっしゃるとおりだと思いますm(__)m<br>特にBBU搭載モデルでもデフォルトがライトスルーであるが為に、現場の設定をみるとそのままRAID構成されて使用されているお客様は多いと思います。<br>ただ、デフォルトをライトバックにできない背景としては、実際にディスク関係のトラブルが発生しデータロストが発生すると(当然ですが)とても大きなお怒りを受けてしまうので(この設定が関連しているかどうかに関わらず)メーカーはデフォルトを安全策の設定にしてしまいがちです。<br>自分も、BBUが搭載されている場合についてはライトバックをデフォルトとして出荷すれば問題ないものと考えている一人です。<br>その場合にはBBUが非搭載であれば(ライトバックに設定していても)ライトスルーで動作しますので問題ないはずです。<br>補足ですが常時ライトバックはBBU搭載有無に関わらずライトバックで動作するモードですがこれは定期的(たしか30日)におこなわれるバッテリキャリブレーションの際には一時的にライトスルーに動作が変わり性能が落ちるのですが常時ライトバックモードではキャリブレーション中もライトバックのまま動作するので性能が落ちないというものです。<br>その為、平常時はどちらも性能が変わりません。<br><br>また、ディスクキャッシュモードを有効にした場合についてはBBU搭載をおこなってもリスクは低減されませんがSATAディスクを搭載している場合には書き込み性能が無効時と比べて数倍も違ってきます。(自分も明確な理由は分かっていないのですが)<br>データロストの際のリスクが低く(冗長などで最悪壊れても大丈夫)SATAディスクを使用し書き込み性能が伸びない場合には有効にしてみる方法は個人的には有りかなと思っています。<br>(SASディスクの場合は大きな違いがないようですので無効で良いと思っています)<br><br>以上、長文・駄文を失礼致しました。
コメントありがとうございます。<br>ディスクキャッシュモード、SATAなら差が出るのですか。自分もSASで試してみたところ有効にしても性能が伸びないどころかむしろ若干下がったような記憶があります。不思議ですね。
そうなんですよね。知り合いがESXiの環境でMegaRAIDSASに2TBのSATAディスクを使っていて、仮想マシンのCentOSにディスクI/Oが増えるとPanicになるというので<br>DiskCacheMode有効にさせたらヌルヌル動くようになったという^^;<br><br>SATAの場合、ディスクのNCQの機能とかがDiskCache設定と連動しているのかな?ただ、最近のSATAディスクがキャッシュを使用する事を前提にチューニングされているだけかもしれませんが....