ブログ

Sysdigが初のクラウドスケールのPrometheusモニタリング製品を発表

Sysdigが初のクラウドスケールのPrometheusモニタリング製品を発表

本文の内容は、2020年3月24日にSysdigのAaron Newcombが投稿したブログ(https://sysdig.com/blog/cloud-scale-prometheus/)を元に日本語に翻訳・再構成した内容となっております。

本日、Sysdig Monitorの大きな前進を発表できることに興奮しています。お客様がSysdigを使用して、Prometheusモニタリングを長期間保持する何百万ものメトリクスにスケーリングできる機能を導入しています。私たちがリリースしている改善により、Sysdigは完全なPrometheus互換性を提供する最初のクラウドスケールモニタリング製品になります。これにより、エンドユーザーは、Prometheusモニタリング標準への投資を維持しながら、スケーラビリティ、生産性、およびトラブルシューティング機能を改善できます。

このリリースには3つの主な機能があります:

  1. Prometheusとの完全な互換性
  2. 比類のない規模と保持
  3. PromCat.ioの紹介
20200325b-1.png

開発者は急速にPrometheusモニタリングを採用して、インフラストラクチャー、アプリケーション、サービスのパフォーマンスを分析しています。13,500を超えるコードコミットと6,300を超えるコントリビューターにより、Prometheusの採用は加速しています。ただし、組織がますます多くのPrometheusサーバーをデプロイするにつれて、スケーリングとワークフローの問題が発生します。集中化されたスケーラブルなメトリクスストアの必要性、Kubernetesクラスター全体の統合されたビュー、クラウドサービス、およびすぐに使用可能な統合などの追加の要件が、リスクを軽減し、アプリケーションの可用性を維持するために必要です。環境のマクロなビューがなければ、クロスプラットフォームの依存関係を持つマイクロサービスの問題を予測することは困難です。

20200325b-2.png

組織は、独自のフェデレーションシステムとデータストアを構築することにより、これらのスケーリングの問題に対処しようとしています。Thanos、Cortex、M3などのオープンソースプロジェクトが役立っていますが、それらはまだ開発の初期段階にあり、カスタマーサポートやトラブルシューティング機能を提供していません。RBACやSSOなどのエンタープライズグレードのアクセスコントロールを必要とする企業は、独自のサポートをデプロイするか、サポートなしで実行する必要があります。さらに、Prometheusモニタリングを拡張して外部サービスからメトリクスを収集するには、時間とリソースがかかる可能性があります。これは、さまざまなレベルの品質とドキュメントで利用できる無数のエクスポーターによるものです。適切なエクスポーターを見つけて維持するために開発リソースを投入することで、それらのリソースを次の優れたアプリケーションの構築から遠ざけることができます。

Sysdigは大胆な決断をしました。これらの問題に対処するための最善のアプローチは、バックエンドとSysdig Monitorを拡張してPrometheusモニタリングをネイティブでサポートすることであると判断しました。Prometheusの単一のコネクターまたはエクスポーターの代わりに、「オールイン」し、お客様がクラウドネイティブな監視を構築するために選択した方法を採用することを決定しました。このようにして、お客様は、より大きなスケール、データ保持、トラブルシューティング、相関、アラート、およびエンタープライズアクセスコントロールを提供するPrometheus互換プラットフォームを使用することで、両方の世界のベストを手に入れます。おー!、そしてセキュリティについて言及しましたか? ええ、Sysdigもそうです。

過去12か月間、当社のエンジニアは完全なPrometheus互換性を提供するためにプラットフォームを変換することに懸命に取り組んできました。彼らは、Prometheusインターフェースに接続するときに必要なバックエンドへの必要なスケーラビリティの構築に忙しくしています。彼らのハードワークは今日の発表で報われ、次の機能を提供できることに興奮しています。

Prometheusとの完全な互換性

では、「完全な互換性」とはどういう意味ですか? つまり、Prometheusの操作に慣れていれば、Sysdigで監視するために何も変更する必要がないということです。 Prometheusモニタリングの時系列データを選択および集計するために使用される関数クエリ言語であるPromQLのサポートを追加しました。つまり、今日の環境でPromQLを使用している場合、Sysdigのデータをクエリするために何も変更する必要はありません。 PromQLは独自のダッシュボードインターフェースに組み込まれているため、フォームベースまたはPromQLのエントリを選択して、必要な情報だけで優れたダッシュボードを作成したり、アラートを構成したりできます。

20200325b-3.png

Grafanaなどのサードパーティツールを使用して、必要に応じて独自のダッシュボードを作成することもできます。SysdigはPrometheus HTTP APIと互換性があり、PromQLを使用してプログラムでモニタリングデータをクエリします。コレクションの観点から、軽量のPrometheusサーバーをエージェントに直接埋め込んで、バックエンドに転送されるメトリクスコレクションを容易にしました。これは、Prometheus構文を使用したフィルタリングと再ラベル付けを行うターゲット、インスタンス、ジョブもサポートします。Sysdigでは、他の方法で使用するのと同じ方法で、何百もの利用可能なPrometheusエクスポーターをSysdigで使用することもできます(これについては後で詳しく説明します)。

Prometheusモニタリングのスケーリングと保持

クラウドネイティブ環境は、エンティティの総数と、これらのエンティティがリサイクル、変更、または複製される頻度の両方で非常に迅速にスケーリングする傾向があります。お客様からは、Prometheusモニタリング用に長期保存が可能なスケーラブルなデータストアを探していることがわかります。このリリースにより、組織は10秒の解像度で数百万の時系列データを保存できるようになり、環境全体のトラブルシューティングを迅速化できます。これらのメトリクスは最長13か月間保存され、今後の傾向分析に役立ちます。

PromCat.io:Prometheusモニタリングリソースカタログ

Prometheusで利用できるエクスポーターの数は近年劇的に増加しています。一般に、これは、組織がビジネスをサポートするさまざまなインフラストラクチャー、アプリケーション、およびサービスからメトリクスとイベントを取り込むことができるため、これは良いことです。ただし、各エクスポーターのテスト、設定、および継続的なメンテナンスは言うまでもなく、どのエクスポーターが適切であるかを知るのは難しい場合があります。Sysdigは、設定、ドキュメント、Sysdigによる公式のカスタマーサポートとのPrometheus監視統合の成長する精選されたカタログであるPromCat.ioを提供することで、この問題の解決に貢献しています。PromCat.ioの詳細については、公式発表をご覧ください。

20200325b-4.png

まとめ

Sysdigは、トラブルシューティング、エンタープライズアクセスコントロール、およびセキュリティとともにPrometheusの完全な互換性を提供する初のクラウドスケールのモニタリング製品です。Sysdigを使用すると、企業は、規模、可視性、またはサポートを犠牲にすることなく、Prometheusモニタリングへの投資を維持できます。新しいクラウドサービスと刻々と変化するインフラストラクチャーを使用して、PromCat.ioの厳選されたサポート対象のPrometheusエクスポーター、アラート、ダッシュボードを使用して監視機能を拡張できます。

これらの機能は、今後数か月でお客様にロールアウトされます。 新機能のプレビューについては、Sysdigモニターの概要ビデオをご覧ください。 Sysdigを初めて使用する場合は、無料の試用版を開始して、クラウドネイティブな監視がいかに簡単かを体験してください。

最近の投稿

カテゴリー

アーカイブ

ご質問・お問い合わせはこちら

top