Sysdig

SCSK株式会社

ブログ

HOME Developer Square ブログ Sysdig運用の基本!トラブルシューティングのポイントを解説

Sysdig運用の基本!トラブルシューティングのポイントを解説

🐢はじめに

みなさんこんにちは!SCSK技術者ブログ 第33回を担当します鳥飼です。
アプリケーションが突然停止したり、リソース使用量が急増したり...システム運用において、予期せぬトラブルはつきものです。 もちろん、Sysdigもソフトウェアであるため、問題が全く発生しないとは限りません。
Sysdigのエージェントが繋がらない」「期待通りに動作しない
そんな時でも、この記事を読めば、原因を特定するためのポイントや調査方法がわかり、冷静に対処できるようになります。 今回は、みなさまのSysdig運用を少しでも快適にするための、トラブルシューティングの基本ステップをご紹介します。

🎯この記事のポイント

本記事では、Sysdigのトラブルシューティングを以下の3ステップで解説します。

  1. ドキュメントで「仕様」か「問題」かを確認する
  2. 問題の所在を切り分ける(導入環境 or Sysdig SaaS)
  3. 導入環境のAgentログを調査する

この流れに沿って確認することで、迅速な原因究明に繋がります。

📖ステップ1:それは仕様?問題? まずは公式ドキュメントを確認

意図しない動作に遭遇した際、まず確認すべきは「それが仕様かどうか」です。公式ドキュメントで、機能の正しい動作や設定方法を確認しましょう。

「ドキュメントが英語で...」「どこを読めばいいかわからない」という方でもご安心ください。 SysdigのドキュメントサイトにはAIチャット機能が搭載されており、日本語で質問できます。
AIは回答と合わせて関連ドキュメント(リファレンス)も提示してくれます。ただし、AIの回答が常に正しいとは限りませんので、回答を鵜呑みにせず、必ずリファレンス先のドキュメントも参照するようにしましょう。

sysdig_doc.jpg

🤖ステップ2:問題はどこ? 導入環境とSysdig SaaSの切り分け

Sysdigで発生するトラブルは、原因の所在が「お客様の導入環境」にあるか、「SysdigのSaaSプラットフォーム」にあるかで大きく分けられます。

○導入環境側の確認ポイント

SaaSプラットフォームと各環境のエージェントが正常に通信できているかを確認します。 Sysdig UIの Integrations > Sysdig Agents を開き、対象ホストが表示されているか、またステータスが Up to dateになっているかを確認してください。
もしホストが表示されない、または Disconnected となっている場合、お客様の導入環境(エージェント、ネットワーク経路など)に問題がある可能性が高いです。次のステップ3に進み、ログを確認しましょう。

sysdig-agent-status.jpg

○Sysdig SaaS側の確認ポイント

SysdigのSaaSプラットフォーム側で障害が発生している可能性も考えられます。 ご利用リージョンの稼働状況は、下記のStatusページで確認できます。

もしお使いのリージョンで障害が報告されている場合は、復旧まで待つ必要があります。

sysdig-app-status.jpg

[補足] Statusページを都度見に行くのは大変です。障害情報をメールやSlackで受け取るよう設定しておくと、インシデントの発生を迅速に検知できて便利です。

💻ステップ3:導入環境のエージェントログを調査する

ステップ2で導入環境側に問題があると判断した場合、エージェントのログを確認します。エラーメッセージが出力されている場合が多く、原因究明の大きな手がかりとなります。
環境に応じて、以下のコマンドでログを確認し、errorなどのキーワードで検索してみてください。下記のコマンド例は、Linux上の環境を想定しています。

◇Kubernetes環境

$ kubectl logs -n   | grep -i error

◇非Kubernetes環境 (コンテナ環境)

$ docker logs <コンテナ名> | grep -i error

◇ホスト環境

$ cat /opt/draios/logs/draios.log | grep -i error

[ログ出力例]

例えば、以下のログはライセンス上限数を超えるエージェントを接続しようとしたために発生したエラーです。このメッセージから、ライセンス数の見直しが必要だと判断できます。

 Error, conn_mgr:connection_manager:884: Received error message: ERR_CONN_LIMIT (Too many agent connections.)
また、よくあるエラーについては、公式のトラブルシューティングガイドにもまとめられています。

もちろん、ステップ1で紹介したドキュメントのAIにエラーログを貼り付けて、解決策を尋ねるのも有効な手段です。

sysdig-trouble-shooting.jpg

📝まとめ

今回はSysdigのトラブルシューティングについて、基本的な切り分けの流れと調査方法をご紹介しました。

  1. 公式ドキュメント(AIチャット)で仕様を確認
  2. 管理画面とStatusページで問題の所在を切り分け
  3. エラーログをヒントに原因を調査

これらのステップを踏むことで、多くの問題に冷静かつ迅速に対応できるはずです。

もちろん、本記事の手順で解決が難しいケースもあります。その際はSysdig社のサポートへお問い合わせください。 また、弊社SCSKよりSysdigライセンスをご契約いただいたお客様には、日本語での技術サポートを提供しております。Sysdigの導入や運用にご興味がございましたら、ぜひお気軽にご相談ください。
お問い合わせはこちらから: https://ite.scsk.jp/Sysdig_Inquiryform

担当者紹介

SCSK 鳥飼
担当者名
鳥飼
コメント
Sysdigを中心にコンテナ、Kubernetes、クラウド領域の業務に従事しています。
保有資格
Certified Kubernetes Administrator

SCSK技術者ブログ

Sysdig運用の基本!トラブルシューティングのポイントを解説

Sysdig運用の基本!トラブルシューティングのポイントを解説

クラウドにおけるサーバーレスワークロードの保護:Sysdig Secureによるアプローチ

クラウドにおけるサーバーレスワークロードの保護:Sysdig Secureによるアプローチ

Platform Engineering Kaigi 2025 参加レポート

Platform Engineering Kaigi 2025 参加レポート

検知から対応をシームレスに! Sysdigの新機能「Response Action」でインシデント対応を迅速化

検知から対応をシームレスに! Sysdigの新機能「Response Action」でインシデント対応を迅速化

【SCSK技術者によるブログ】生成AIでSysdigエージェントのアップグレードを効率化 〜Helm values.yamlの移行作業を自動化〜

【SCSK技術者によるブログ】生成AIでSysdigエージェントのアップグレードを効率化 〜Helm values.yamlの移行作業を自動化〜

【SCSK技術者によるブログ】Sysdigの「Search」機能を体験!生成AIでクエリの学習コスト無しに脆弱性調査

【SCSK技術者によるブログ】Sysdigの「Search」機能を体験!生成AIでクエリの学習コスト無しに脆弱性調査

【SCSK技術者によるブログ】ゼロトラスト文脈でのクラウドセキュリティ、そしてSysdig

【SCSK技術者によるブログ】ゼロトラスト文脈でのクラウドセキュリティ、そしてSysdig

【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ネットワークポリシー編~

【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ネットワークポリシー編~

【SCSK技術者によるブログ】生成AIで過検知対策を効率化!Sysdig Sageの実力検証

【SCSK技術者によるブログ】生成AIで過検知対策を効率化!Sysdig Sageの実力検証

【SCSK技術者によるブログ】なぜ今、Sysdigが選ばれるのか?動画で解説!クラウドネイティブセキュリティの最前線 - SCSKの日本語伴走サポートで安心導入

【SCSK技術者によるブログ】なぜ今、Sysdigが選ばれるのか?動画で解説!クラウドネイティブセキュリティの最前線 - SCSKの日本語伴走サポートで安心導入

【SCSK技術者によるブログ】Serverless AgentがAzure Container Appsに対応しました

【SCSK技術者によるブログ】Serverless AgentがAzure Container Appsに対応しました

【SCSK技術者によるブログ】システムコール分析における生成AIの活用

【SCSK技術者によるブログ】システムコール分析における生成AIの活用

【SCSK技術者によるブログ】Sysdig情報アップデート~AWS連携にS3オプションが追加されました~

【SCSK技術者によるブログ】Sysdig情報アップデート~AWS連携にS3オプションが追加されました~

【SCSK技術者によるブログ】Falco初学者講座 - Exceptions編

【SCSK技術者によるブログ】Falco初学者講座 - Exceptions編

【SCSK技術者によるブログ】Falco初学者講座 - List/Macro編

【SCSK技術者によるブログ】Falco初学者講座 - List/Macro編

【SCSK技術者によるブログ】コンテナの電力消費をSysdig Monitorで監視してみよう

【SCSK技術者によるブログ】コンテナの電力消費をSysdig Monitorで監視してみよう

【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~Contianer Drift編~

【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~Contianer Drift編~

【SCSK技術者によるブログ】~Falco初学者に送る~ Sysdig SageでFalcoを勉強してみよう②

【SCSK技術者によるブログ】~Falco初学者に送る~ Sysdig SageでFalcoを勉強してみよう②

【SCSK技術者によるブログ】~Falco初学者に送る~ Sysdig SageでFalcoを勉強してみよう①

【SCSK技術者によるブログ】~Falco初学者に送る~ Sysdig SageでFalcoを勉強してみよう①

【 SCSK技術者によるブログ】Sysdigの設定をTerraformで管理してみた(Monitor編)

【 SCSK技術者によるブログ】Sysdigの設定をTerraformで管理してみた(Monitor編)

【SCSK技術者によるブログ】Falco初学者講座 - condition編

【SCSK技術者によるブログ】Falco初学者講座 - condition編

【SCSK技術者によるブログ】Sysdig Sageを使ってみた

【SCSK技術者によるブログ】Sysdig Sageを使ってみた

【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ポリシーエンジン編②~

【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ポリシーエンジン編②~

【SCSK技術者によるブログ】Sysdigをセキュアに使おう~IP Allowlist編~

【SCSK技術者によるブログ】Sysdigをセキュアに使おう~IP Allowlist編~

【SCSK技術者によるブログ】Node ExporterをSysdig Monitorに連携してみた

【SCSK技術者によるブログ】Node ExporterをSysdig Monitorに連携してみた

【SCSK技術者によるブログ】Sysdigの設定をTerraformで管理してみた

【SCSK技術者によるブログ】Sysdigの設定をTerraformで管理してみた

【SCSK技術者によるブログ】CNAPPの理解とSysdigのカバレッジ

【SCSK技術者によるブログ】CNAPPの理解とSysdigのカバレッジ

【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~マルウェア検知編~

【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~マルウェア検知編~

【SCSK技術者によるブログ】Sysdigのライセンス体系

【SCSK技術者によるブログ】Sysdigのライセンス体系

【SCSK技術者によるブログ】Sysdig とMicrosoft Entra ID間でSAML認証設定を試してみた

【SCSK技術者によるブログ】Sysdig とMicrosoft Entra ID間でSAML認証設定を試してみた

【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ポリシーエンジン編~

【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ポリシーエンジン編~

【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~AWSサインインなりすまし検知編~

【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~AWSサインインなりすまし検知編~

【SCSK技術者によるブログ】Sysdig SecureのRisks機能を試してみた

【SCSK技術者によるブログ】Sysdig SecureのRisks機能を試してみた

【SCSK技術者によるブログ】Sysdigの防御機能Kill Processを試してみた

【SCSK技術者によるブログ】Sysdigの防御機能Kill Processを試してみた

ページトップへ