Sysdig運用の基本!トラブルシューティングのポイントを解説
🐢はじめに
みなさんこんにちは!SCSK技術者ブログ 第33回を担当します鳥飼です。
アプリケーションが突然停止したり、リソース使用量が急増したり...システム運用において、予期せぬトラブルはつきものです。 もちろん、Sysdigもソフトウェアであるため、問題が全く発生しないとは限りません。
「Sysdigのエージェントが繋がらない」「期待通りに動作しない」
そんな時でも、この記事を読めば、原因を特定するためのポイントや調査方法がわかり、冷静に対処できるようになります。 今回は、みなさまのSysdig運用を少しでも快適にするための、トラブルシューティングの基本ステップをご紹介します。
🎯この記事のポイント
本記事では、Sysdigのトラブルシューティングを以下の3ステップで解説します。
- ドキュメントで「仕様」か「問題」かを確認する
- 問題の所在を切り分ける(導入環境 or Sysdig SaaS)
- 導入環境のAgentログを調査する
この流れに沿って確認することで、迅速な原因究明に繋がります。
📖ステップ1:それは仕様?問題? まずは公式ドキュメントを確認
意図しない動作に遭遇した際、まず確認すべきは「それが仕様かどうか」です。公式ドキュメントで、機能の正しい動作や設定方法を確認しましょう。
- Sysdig Documentation: https://docs.sysdig.com/en/
「ドキュメントが英語で...」「どこを読めばいいかわからない」という方でもご安心ください。 SysdigのドキュメントサイトにはAIチャット機能が搭載されており、日本語で質問できます。
AIは回答と合わせて関連ドキュメント(リファレンス)も提示してくれます。ただし、AIの回答が常に正しいとは限りませんので、回答を鵜呑みにせず、必ずリファレンス先のドキュメントも参照するようにしましょう。
🤖ステップ2:問題はどこ? 導入環境とSysdig SaaSの切り分け
Sysdigで発生するトラブルは、原因の所在が「お客様の導入環境」にあるか、「SysdigのSaaSプラットフォーム」にあるかで大きく分けられます。
○導入環境側の確認ポイント
SaaSプラットフォームと各環境のエージェントが正常に通信できているかを確認します。 Sysdig UIの Integrations > Sysdig Agents を開き、対象ホストが表示されているか、またステータスが Up to dateになっているかを確認してください。
もしホストが表示されない、または Disconnected となっている場合、お客様の導入環境(エージェント、ネットワーク経路など)に問題がある可能性が高いです。次のステップ3に進み、ログを確認しましょう。
○Sysdig SaaS側の確認ポイント
SysdigのSaaSプラットフォーム側で障害が発生している可能性も考えられます。 ご利用リージョンの稼働状況は、下記のStatusページで確認できます。- Sysdig Status: https://status.sysdigcloud.com/
もしお使いのリージョンで障害が報告されている場合は、復旧まで待つ必要があります。
[補足] Statusページを都度見に行くのは大変です。障害情報をメールやSlackで受け取るよう設定しておくと、インシデントの発生を迅速に検知できて便利です。
💻ステップ3:導入環境のエージェントログを調査する
ステップ2で導入環境側に問題があると判断した場合、エージェントのログを確認します。エラーメッセージが出力されている場合が多く、原因究明の大きな手がかりとなります。
環境に応じて、以下のコマンドでログを確認し、errorなどのキーワードで検索してみてください。下記のコマンド例は、Linux上の環境を想定しています。
◇Kubernetes環境
$ kubectl logs -n| grep -i error
◇非Kubernetes環境 (コンテナ環境)
$ docker logs <コンテナ名> | grep -i error
◇ホスト環境
$ cat /opt/draios/logs/draios.log | grep -i error
[ログ出力例]
例えば、以下のログはライセンス上限数を超えるエージェントを接続しようとしたために発生したエラーです。このメッセージから、ライセンス数の見直しが必要だと判断できます。
Error, conn_mgr:connection_manager:884: Received error message: ERR_CONN_LIMIT (Too many agent connections.)また、よくあるエラーについては、公式のトラブルシューティングガイドにもまとめられています。
もちろん、ステップ1で紹介したドキュメントのAIにエラーログを貼り付けて、解決策を尋ねるのも有効な手段です。
📝まとめ
今回はSysdigのトラブルシューティングについて、基本的な切り分けの流れと調査方法をご紹介しました。
- 公式ドキュメント(AIチャット)で仕様を確認
- 管理画面とStatusページで問題の所在を切り分け
- エラーログをヒントに原因を調査
これらのステップを踏むことで、多くの問題に冷静かつ迅速に対応できるはずです。
もちろん、本記事の手順で解決が難しいケースもあります。その際はSysdig社のサポートへお問い合わせください。 また、弊社SCSKよりSysdigライセンスをご契約いただいたお客様には、日本語での技術サポートを提供しております。Sysdigの導入や運用にご興味がございましたら、ぜひお気軽にご相談ください。
お問い合わせはこちらから: https://ite.scsk.jp/Sysdig_Inquiryform
担当者紹介
- 担当者名
- 鳥飼
- コメント
- Sysdigを中心にコンテナ、Kubernetes、クラウド領域の業務に従事しています。
- 保有資格
- Certified Kubernetes Administrator
SCSK技術者ブログ
Sysdig運用の基本!トラブルシューティングのポイントを解説
クラウドにおけるサーバーレスワークロードの保護:Sysdig Secureによるアプローチ
Platform Engineering Kaigi 2025 参加レポート
検知から対応をシームレスに! Sysdigの新機能「Response Action」でインシデント対応を迅速化
【SCSK技術者によるブログ】生成AIでSysdigエージェントのアップグレードを効率化 〜Helm values.yamlの移行作業を自動化〜
【SCSK技術者によるブログ】Sysdigの「Search」機能を体験!生成AIでクエリの学習コスト無しに脆弱性調査
【SCSK技術者によるブログ】ゼロトラスト文脈でのクラウドセキュリティ、そしてSysdig
【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ネットワークポリシー編~
【SCSK技術者によるブログ】生成AIで過検知対策を効率化!Sysdig Sageの実力検証
【SCSK技術者によるブログ】なぜ今、Sysdigが選ばれるのか?動画で解説!クラウドネイティブセキュリティの最前線 - SCSKの日本語伴走サポートで安心導入
【SCSK技術者によるブログ】Serverless AgentがAzure Container Appsに対応しました
【SCSK技術者によるブログ】システムコール分析における生成AIの活用
【SCSK技術者によるブログ】Sysdig情報アップデート~AWS連携にS3オプションが追加されました~
【SCSK技術者によるブログ】Falco初学者講座 - Exceptions編
【SCSK技術者によるブログ】Falco初学者講座 - List/Macro編
【SCSK技術者によるブログ】コンテナの電力消費をSysdig Monitorで監視してみよう
【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~Contianer Drift編~
【SCSK技術者によるブログ】~Falco初学者に送る~ Sysdig SageでFalcoを勉強してみよう②
【SCSK技術者によるブログ】~Falco初学者に送る~ Sysdig SageでFalcoを勉強してみよう①
【 SCSK技術者によるブログ】Sysdigの設定をTerraformで管理してみた(Monitor編)
【SCSK技術者によるブログ】Falco初学者講座 - condition編
【SCSK技術者によるブログ】Sysdig Sageを使ってみた
【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ポリシーエンジン編②~
【SCSK技術者によるブログ】Sysdigをセキュアに使おう~IP Allowlist編~
【SCSK技術者によるブログ】Node ExporterをSysdig Monitorに連携してみた
【SCSK技術者によるブログ】Sysdigの設定をTerraformで管理してみた
【SCSK技術者によるブログ】CNAPPの理解とSysdigのカバレッジ
【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~マルウェア検知編~
【SCSK技術者によるブログ】Sysdigのライセンス体系
【SCSK技術者によるブログ】Sysdig とMicrosoft Entra ID間でSAML認証設定を試してみた
【SCSK技術者によるブログ】Sysdigと組み合わせて効果的なソリューションのご紹介 ~ポリシーエンジン編~
【SCSK技術者によるブログ】Sysdigの脅威検知はFalcoだけじゃない ~AWSサインインなりすまし検知編~
【SCSK技術者によるブログ】Sysdig SecureのRisks機能を試してみた