ブログ

PromCat: エンタープライズクラスのPrometheusモニタリング用のリソースカタログ

PromCat: エンタープライズクラスのPrometheusモニタリング用のリソースカタログ

本文の内容は、2020年3月24日にSysdigのCarlos Arillaが投稿したブログ(https://sysdig.com/blog/promcat-prometheus-catalog/)を元に日本語に翻訳・再構成した内容となっております。

PromCat、Prometheus Catalogの略で、エンタープライズクラスのPrometheusモニタリング用のリソースカタログです。

20200325a-title.png

Prometheusは、クラウドネイティブ環境を監視する方法において革新的であり、オープンソースコミュニティから多大な注目を集め、Prometheus監視リソースの量が爆発的に増加しています。現在、利用可能なリソースが非常に多いため、適切なリソースを除外して、文書化が不十分または古いものを破棄することは、もはや容易ではありません。

スケーラブルなPrometheusモニタリングエクスペリエンスを提供するための取り組みにおいて、成功するには、企業がモニタリング統合の信頼性の高いツールボックスを必要としていることがわかりました。スケールとセキュリティコントロールに加えて、次の質問に対する迅速な回答が必要です。「自分の環境でX、Y、Zを監視するにはどうすればよいですか?」

これが、Kubernetesプラットフォームとクラウドネイティブサービスの監視統合、ドキュメント化、サポートされたモニタリング統合を見つけることができるリソースカタログであるPromCatを作成した理由です。

Prometheusエコシステムの強力な成長により、莫大な量の監視リソースがもたらされました。これまで以上に多くのコンテンツがありますが、エンタープライズ環境向けの本番環境対応のリソースを、テストされていないDIY実験とどのように区別できますか? 現在の課題はコンテンツを見つけることではなく、セットアップとメンテナンスに何日も費やすことなく、本番環境に対応できる適切なリソースを見つけることです。

信頼性の高いPrometheusモニタリングシステムを実装するには、メトリクスソース(アプリケーションのエクスポーター、インストルメント化されたサービス、またはインスツルメンテーションライブラリ)、Prometheusメトリクスコレクション(サービスディスカバリ、ジョブ、フィルタリングおよび再ラベル付けまたは記録ルール)、ダッシュボード、アラートを緊密に統合する必要があります。これらのさまざまな部品をすべて連携させることは大変な作業であり、時間をかけて設定および維持するにはかなりの労力が必要です。

20200325a-1.png

以下は、見つけることができるリソースの例です:

  • Githubのさまざまなサービスとプラットフォーム用の複数のエクスポーター
  • 多くの異なるダッシュボード、多くの場合Grafanaダッシュボード
  • Kubernetesのミックスイン、すばらしいですが、Kubernetesに限定されています

このコンテンツにより、エンタープライズ監視ユーザーは複数の問題を発見します。

1つ目はセグメンテーションです。検索するサービス、プラットフォーム、バージョン、場所が多すぎる。 適切なツールを見つけるのに時間がかかりすぎます。

いったん見つけたら、それらをどのように評価して、リソースが機能が完全で本番用レベルであることを確認できますか? それらが単なるコンセプトの証明ではないことをどのように確認できますか?

また、リソースをテストする前に、リソースをどのようにダウンロードする必要がありますか? DockerHubではコンテナイメージとしてパッケージ化されることもありますが、そうでない場合もあります。

20200325a-2.png

本当に優れたエクスポーターやダッシュボードを使用している場合でも、すべてを組み合わせるのは困難です。パズルのさまざまな部分では、使用するものと必ずしも互換性のないさまざまなメトリクス名、ラベル、およびグループを使用しています。異なるバージョンのエクスポーターと特定のアプリバージョン、ダッシュボード、またはアラートの間の互換性の問題を見つける場合があります。

20200325a-3.png

さらに複雑なことに、これらのリソースの使用方法と統合方法に関するドキュメントが不足しています。

エンタープライズモニタリングでは、環境のモニタリングを設定するとき、または障害が発生したときにサポートを使用して、使用する統合に対する信頼が必要です。統合に使用する必要があるPrometheusエクスポーター、ダッシュボード、アラートのバージョン、および変更に対応する方法を理解するために1週間費やすことができるとお客様から聞いています。

20200325a-4.png

エンタープライズクラスの監視用にサポートされているPrometheus統合

道は私たちにとってかなり明確です。エンタープライズグレードのPrometheusモニタリングエクスペリエンスを提供したいと考えています。これを実現するために、1秒間に数百万の時系列にスケーリングするバックエンドと長期ストレージを提供しています。さらに、当社の製品は、APIおよびPromQLクエリ、ダッシュボード、アラートを通じて、Prometheusとの完全な互換性を持つお客様のワークフローに適応します。 PrometheusオープンソースエクスポーターやGrafanaダッシュボードなど、便利なツールを使い続けることができます。

しかし、これだけでは十分ではありません。

これが、私たちがすでにお客様に推奨している素晴らしい監視リソースをすべてまとめることにした理由です。そしてさらに一歩進んで、私たちはそれらを共有して、誰もが利益を得られるようにします。 これがPromCatが生まれた理由です。

20200325a-5.png

私たちの主な目標は、利用可能なすべてのコンテンツをリストすることではありません。Prometheusプロジェクトにはすでにエクスポーターがリストされています。 代わりに、私たちは基準を引き上げ、キュレート、テスト、文書化したコンテンツを一覧表示し、最も重要なことに、以下を含むSysdigのお客様のためにサポートしたいと考えています。

  • Kubernetesのデプロイマニフェストを含むコンテナイメージとしてパッケージ化されたPrometheusおよびサードパーティのエクスポーター
  • GrafanaとSysdigの両方のダッシュボード。お客様のほとんどは、Sysdig統合ダッシュボードを気に入っています。これには、チームスコープとRBACがあり、トラブルシューティングやセキュリティ機能とともに利用できます。ただし、一部の上級ユーザーは、Sysdigメトリクスを備えたGrafanaを好み、ダッシュボードエクスペリエンスのすべての詳細をカスタマイズできます。このカタログでは両方がサポートされています。
  • AlertManagerとSysdig PromQLの両方のアラート定義
  • 大量のルールがある場合にメトリクスを事前計算するための記録ルール

これらのリソースの多くはオープンソースソフトウェアとしてすでに利用可能であるため、私たちの妥協点は、最初にそれらを作成したコミュニティにも還元することです。 メンテナンスとサポートの一環として、バグ修正と改善を提供します。

PromCatの次の予定

私たちは本日、Kubernetesコントロールプレーン、Istioサービスメッシュ、および増加するAWSサービスのリスト用のモニタリングリソースを備えたPromCatをリリースします。

Sysdig統合エンジニアは、クラウドネイティブ環境での一般的なサービスに新しいリソースを追加し、環境内のこれらの統合のパッケージ化とセットアッププロセスを改善するために既に取り組んでいます。サポートを拡張したいサービスとプラットフォームのかなりロングリストがあります。

Sysdigのお客様やパートナーと一緒に次に何をするかを決定したいと考えています。

エンタープライズクラスのPrometheusモニタリング用のリソースを閲覧およびダウンロードするには、PromCat.ioにアクセスしてください。 これらのリソースは、Sysdigの新しいクラウドスケールのPrometheusモニタリング機能とともに、今日使用できます。 Sysdigをまだテストしていませんか? 今すぐ無料トライアルにサインアップしてください!

ご質問・お問い合わせはこちら

top