コラム/技術的な情報

モニタリング製品導入における効果と価値(1)

システム運用のカギはMTTR短縮にあり

 24時間365日、日々安定したシステム運用を実現すべく、各企業はシステムの可用性を向上させるようさまざまな努力をしてきました。
 さらに、DXが推進されている昨今ではシステム運用の重要性がより高まっており、ITサービスを提供している事業者にとどまらず、社内システム運用の安定した提供と信頼向上に向け、「MTTR」という指標に注目する企業はこれまで以上に増加しています。
 今回はこの「MTTR」短縮におけるプロセスと効果について考えてみたいと思います。

「MTTR」とは?

 システム障害が発生すると、システム担当者はログ等を解析し、原因を特定、解決するための作業を行い、その後、問題から復旧できているかを確認します。
 「MTTR(Mean-Time-To-Repair:平均復旧時間)」は、このシステム障害の発生から復旧確認までにかかる平均時間を指しており、フローに沿って4段階で構成され、次のような名称が付けられています。

  • MTTI(Mean-Time-To-Identify:平均検知時間)
  • MTTK(Mean-Time-To-Knowledge:平均解析時間)
  • MTTF(Mean-Time-To-Fix:平均改修時間)
  • MTTV(Mean-Time-To-Verify:平均確認時間)
MTTR(平均復旧時間):フローに沿って4段階で構成

 システム障害の発生において、特に障害の検知(MTTI)と原因の特定にかかる時間(MTTK)が大半を占めていることがほとんどといわれており、これらの改善に焦点を当てた対策をとることで「MTTR」を大幅に短縮させることができると考えられています。

MTTR短縮方法と効果

 障害復旧にかかる時間が長引くほど、自社のビジネスや社員に与えるインパクトは多大なものになります。そのため、できるだけMTTRの短縮を目指したいところですが、具体的にはどのように短縮させていけばいいのでしょうか。

 「MTTR」を短縮する方法としては、特に時間を要している「MTTI」および「MTTK」を大幅に短縮するためのツールを導入し、「質」で対処するか、または、障害対応にあたる人員を増やし「量」で対応するかという方法が挙げられます。
 ですが、残念ながら「質」であるツールについては、運用に高度なスキルを要するものも多く、またそれらの運用に特化した人材の確保も困難であり、また一過性の障害対応のために人員を増強するという「量」についての対策も現実的ではなく、企業によっては「MTTR短縮」の議論は置き去りにせざるを得ない状況がありました。

MTTR短縮方法と効果

MTTR短縮を実現した「パケットキャプチャ+統計可視化」ツール

 そうした中で、昨今は「質=ツールの導入」での対処方法として、「パケットキャプチャ+統計可視化」が可能な『NetScout nGenius』が注目されています。
 『NetScout nGenius』の導入はMTTR短縮に直結するものであり、その費用対効果は導入した多くの大手企業で高く評価されています。
 導入されたお客様の中には、オープンソースの「パケットキャプチャ+プロトコル解析ツール」によって数時間かかっていた調査が、『NetScout nGenius』導入後は、数分で完結できたというケースも存在します。
 (※お客さまの環境やご使用方法により異なりますので、詳細は別途ご相談ください。)

 『NetScout nGenius』は、ネットワークに関わる問題の早期警告と、根本原因を速やかに特定する機能を備えており、MTTIおよびMTTKの両方を短縮させるための道筋を描けることが特徴です。
 MTTR削減の強い味方として、ご関心がございましたら、当社営業担当者にお問い合わせください。また、下記より資料のダウンロードも可能です。ぜひご活用ください。
https://www.scsk.jp/sp/netscout/catalog/index.html

製品に関するご質問・資料請求はこちらまで

03-5859-3034 平日 9:30 ~ 17:00(年末年始、当社指定休業日を除く)