[トップ] - [プロジェクトマネージメント用語集] - [CFIA]
CFIA とはシステムの各コンポーネントで障害が発生した場合の影響度を計算しその対策を行う分析手法のことです。Component Failure Impact Analysisの略称で構成要素障害影響分析と呼びます。元々はIBM (Internal Business Machines) により開発されましたが現在はよく使われるプロジェクト手法です。
分かりやすい例で説明します。一般的な自転車をCFIAで分析します。分析の目的は「単一故障で事故を起こさない」ということです。
部品 | 故障時 | 影響 | 故障に対する対策 |
ハンドル | 自転車が操作できない | 〇ブレーキを使えば制御が可能 | - |
ペダル | 自転車をこげない | 〇動かないだけで事故の可能性なし | - |
チューブ | パンクで動かない | 〇自転車の速度が出ない | - |
ライト | 電気が付かない | 〇夜間に走行jできない | - |
ブレーキ | 自転車が止まらない | ×走行中に故障(切断等)すると衝突により事故になる可能性あり | ブレーキを2個装備して、1個の故障でも事故が発生しない仕組みとする。 |
次は一般的な物理サーバで分析してみます。
物理サーバで業務を稼働させるとします。分析の目的は「単一障害で業務を停止させない」ということです。
部品 | 個数 | 故障時 | 影響 | 単一故障に対する対策 |
メモリ | 1 | サーバ停止 | ×サーバダウン | サーバを2台にして単一障害でも業務停止しない設計とする |
CPU | 1 | サーバ停止 | ×サーバダウン | サーバを2台にして単一障害でも業務停止しない設計とする |
ディスク | ミラーリング+HotSpare | HotSpareとペアになり連続稼働 | 〇ミラーリングなので影響なし | - |
電源ユニット | 2(冗長化) | 未故障の方で電源の供給を受けて継続稼働 | 〇未故障の方で継続稼働 | - |
NIC(Network Interface Card) | 2(チーミング) | チーミングの未故障側で継続動作 | 〇未故障の方で継続稼働 | - |
以上のように格子型の分析表でコンポーネントを網羅できれば単一障害での影響を網羅でき、影響や対策を検討することができます。このページでは単純な例を挙げましたが実際にはもっと複雑な分析が必要となります。故障時の手順、役割分担、回復までの所要時間、復旧が必要なデータ、切り替え所要時間などの検討が必要となるでしょう。止めることができない業務などでの分析は必須なので是非マスターしてください。