ユーザー事例

LogDNA

LogDNA

会社の詳細

LogDNAログ管理ソリューションは、DevOpsチームがシステムとアプリケーションのすべてのログを単一のプラットフォームに集約することを可能にします。

ビジネスニーズ

  • Kubernetesのロギング機能を顧客に提供
  • Kubernetes上でマイクロサービスとして実行するためのアプリケーションスタック全体の移行

挑戦

  • プロメテウスサーバーの管理に時間がかかっていた
  • デバッグやトラブルシューティングのための監査証跡がない
  • イベント前の注意喚起の欠如が顧客体験に影響を与えた

SYSDIGの導入効果

パフォーマンス問題の解決までの時間を短縮することで、顧客体験を向上。コンプライアンスおよび監査プロセスの効率性の向上。

SYSDIG PLATFORM BENEFITS.

  • 本番リリース前にセキュリティの問題に対処
  • ダッシュボードは、環境で何が起こっているかを理解するのに役立つ
  • 効率的なトラブルシューティングとコンプライアンス報告のための監査証跡
  • すべての環境でダッシュボードとアラートを作成することで、迅速な立ち上がりを実現
  • 最小限のメンテナンスコスト

INFRASTRUCTURE

Amazon Web Services

ORCHESTRATION

Elastic Kubernetes Service (EKS)

概要

LogDNA社は、アプリケーションの開発やデバッグを容易に行うために必要なツールをDevOpsチームに提供する集中型ログ管理ソリューションを提供しています。 同社は、新興企業から大企業まで、何千社もの企業がデータを管理し、ログから価値ある情報を得ることができるよう支援しています。 ここ数年、Kubernetesが成熟するにつれ、LogDNAは、Kubernetesのロギングソリューションを望む顧客が増えていることに気づきました。市場のニーズに応え、一貫性、拡張性、再現性を確保するために、同社はアプリケーションスタック全体をKubernetes上でマイクロサービスとして実行するように移行することを決定しました。

LogDNAのシステムアーキテクトであるRyan Staatz氏によると、

マイクロサービスは物事をもっと面白くしてくれます。私たちが利用しているクラウド環境の1つにAmazon EKSがありますが、これがマネージドサービスであることをとても気に入っています。Kubernetesマスターの管理に集中する必要がなく、自分たちが一番に取り組まねばならないこと、つまりKubernetesでアプリケーションスタックを動かすことに専念できるのです。

LogDNAは、Kubernetes上に24を超えるクラスタを保有し、1,000以上のワーカーノードと21,000以上のポッドで構成されるステートフルアプリケーションとステートレスアプリケーションを混在させて運用しています。

20201208-1.jpg

挑戦

LogDNAはデータビジネスに携わっているため、優れたデータの価値を理解しています。同社は、AWS環境の可視性とセキュリティを向上させる必要があることに気づきました。Staatz氏は次のように説明しています。

誰かが特権コンテナにアクセスすることができてしまえば、ノードのOS設定も簡単に変更することができてしまいます。したがって、これを監視することは本当に重要です。コンテナはセキュアではありません。これが監視が必要な理由の一つです。

当初は Prometheus で監視システムを構築していましたが、LogDNA DevOps チームは Prometheus を拡張することによるリソースの枯渇に気付きました。Staatz氏は次のように述べています。

私たちは独自のアラート管理を始めたのですが、当時それは扱いづらいものでした。Prometheusのデプロイを数十回も繰り返したうえ、それを一貫して管理することは、運用上の大きな負担となっていましたが、Sysdigを使ってKubernetesのメトリクスとセキュリティを監視することで、ロギングに集中できるようになりました。

ソリューションを評価した結果、LogDNAはSysdigを選びました。Staatz氏はこのように述べています。

我々の監視とセキュリティのニーズを満たすには、Sysdig以上の選択肢はありませんでした。Sysdigは、インフラストラクチャやアプリケーションのイベントを含むAWSインフラストラクチャ全体をレポートしてくれます。

顧客に影響を与えるイベントを98%の確率でキャッチする

LogDNAはSysdigのアラート機能をフル活用しています。
Staatz氏はこのように述べています。

Sysdigの本当に素晴らしい機能の一つは、コンテナイメージを継続的にスキャンし、問題がある場合に警告を出してくれることです。
例えば、Lodashのバージョンに脆弱性があると警告された場合、そのコードが本番にアップされる前にチェックする必要があることを知ることができます。 このようなプロアクティブな通知は、迅速なアップデートを行うことに集中している開発者にとって本当に助かります。

我々の監視とセキュリティのニーズを満たすには、Sysdig以上の選択肢はありませんでした
- Ryan Staatzシステムアーキテクト、LogDNA

Sysdigを利用することにより、CI/CD パイプラインでコンテナイメージがビルドされた直後に問題が発生しているかどうか知ることができます。また、依存関係を更新するたびに、明らかに脆弱性のリスクがあるため、私たちは常にSysdigを使って脆弱性を発見し、アラートを出しています。

検知とアラートは、当社だけでなく、顧客にとっても非常に価値のあるものです。これにより、我々は顧客に影響を与えるイベントを、98%の確率で顧客よりも先に特定できるようになり、原因を迅速に特定することができるようになりました。例えば、リソースの競合、セキュリティ上の問題などがあります。一日の終わりに、お客様にどれほど良い体験を提供することができたかが、当社のビジネス価値の尺度となります。Sysdigを使えば、インシデントをより早く解決することができますし、より迅速に識見を得ることもできます。また、パフォーマンスに問題があるかどうかを迅速に判断することもできます。その結果、Sysdigがなければできなかったような、一貫性のあるより良い顧客体験を提供することができるようになりました。

20201208-2.jpg

Sysdigでできることは尽きない

LogDNAはダッシュボードに多くの価値を見出しています。Staatz氏はこのように述べています。

セグメント化されたライン・パネルと変数をスコープする機能は、ピボットを本当に便利にしてくれます。私が多用しているのは、ダッシュボードのスコープをオーバーライドするかどうかを選択できる機能で、複数のセグメントにまたがってコンテキストを提供できるようになっています。

Sysdigは、すぐに使えるダッシュボードを提供し、初心者のユーザーでも何に焦点を当てるべきかサポートします。また、業務の成熟度に合わせて独自のダッシュボードを構築することも可能にします。

見たい内容に合わせてカスタマイズされたダッシュボードを設定できることにとても感謝しています

とStaatz氏は述べています。

私は最近、特定のポッドセットのディスク使用量を追跡するダッシュボードを作りました。グラフは、Kubernetesクラスタでセグメント化されたものもあれば、マウントポイントでセグメント化されたものもあります。

Sysdigを使えば、インシデントをより早く解決することができますし、より早い識見を得ることができます。また、パフォーマンスに問題があるかどうかを迅速に判断することができます。その結果、Sysdigがなければできなかったであろう、一貫性のあるより良い顧客体験を提供することができるようになりました。
- Ryan Staatzシステムアーキテクト、LogDNA

スコープでは特定のクラスタを選択することができますが、クラスタ固有のグラフをクラスタごとにセグメント化されたグラフと比較することで、必要に応じて簡単にコンテキストを確認することができます。

また、これらのダッシュボードにアラートを重ねて見ることができるのも気に入っています。これにより、アラートと特定のアクティビティの間に相関関係があるかどうかを確認することができます。これは、ネットワークの問題、CPUの競合、メモリ、またはElasticSearchで保留中のタスクが多すぎることを発見した場合など、単純なことでも常に使用しています。すべてが一か所にまとめられていて、非常に素晴らしいものです。Sysdigでできることは尽きることがありません。

高速・簡単なセットアップと最小限のメンテナンス

Sysdigのセットアップとメンテナンスについて、Staatz氏はこのように述べています。

セットアップはとても簡単です。設定をいくつか入れると、Sysdigはデーモンセットを実行してエージェントをデプロイしてくれます。それだけで、メトリクスはすべて自動的にSysdigに送信され、素晴らしいUIで見ることができます。また、通常のパフォーマンスメトリクスやアプリケーションメトリクスだけでなく、セキュリティに関する識見も見ることができます。Sysdigがデフォルトで収集しているデータ量の多さに驚きました。私たちは多くの作業をする必要はなく、すでに準備されています。私たちは、私たちが望むダッシュボードを作るだけですが、既にそれさえもSysdigには用意されています。

Staatz氏は、

SysdigがKubernetesと互換性があるという事実は、私たちにとって大きな魅力でした。Kubernetesに関するセキュリティの問題の多くは新しいもので、最初はそれに対処するのが難しいものです。Sysdigはその多くを助けてくれますし、Sysdig自体のスタック管理をする必要がないので、最終的には私たちの業務が楽になり、自分たちのアプリケーションスタックのデバッグに集中できるようになりました。

Sysdig Captureでコンプライアンス監査が容易に

SysdigはSysdig Captureと呼ばれる機能を提供しており、異常な動作が発生した場合の監査証跡を記録し、イベント後の調査やトラブルシューティングに役立てています。Staatz氏はこのように述べています。

Sysdig CaptureはTCPダンプ形式の情報を保存したもので、調べたい対象領域がある場合に利用できます。これには、接続が行われているかどうか、何が起こっているか、イベントが発生しているかどうかなどの情報が含まれます。

Sysdigが取得したCaptureを利用することで、LogDNAは、どのような観点からでも切り取って分析できる膨大な量のデータにアクセスすることができます。Sysdig CaptureはSysdig独自のものであり、監査ファイルを提供します。Staatz氏はこのように述べています。

ホスト、ノード、ポッドレベルで、あらゆる種類の情報を得ることができます。ポリシーイベントについて知りたいことがあれば何でもログに記録することができます。そのため、特にコンプライアンスや監査に関して、セキュリティチームに重宝されています。

Sysdigがデフォルトで収集しているデータ量の多さに驚きました。私たちは多くの作業をする必要はなく、すでに準備されています。私たちは、私たちが望むダッシュボードを作るだけですが、既にそれさえもSysdigには用意されています。
- Ryan Staatzシステムアーキテクト、LogDNA

Sysdig は困難な問題に対する迅速なトラブルシューティングに役立ちます

また、Sysdig Capture監査証跡を提供し、異常な動作があったがコンテナが強制終了した場合にLogDNAを支援します。

Sysdigは、不正なアクセスを確認して警告するだけでなく、カスタムポリシーを設定することもできます

とStaatz氏は述べています。

例えば、特定の事象が発生した場合に特定の情報をキャプチャするポリシーを設定して、後でトラブルシューティングするためのファイルを取得しておくことができます。

トラブルシューティングについて、Staatz氏はこのように述べています。

誰かがコンテナにアクセスし、executing commandを実行した場合、Sysdigはそのセッションを記録します。それがアラートを出してくれるので、何が起きているのかをすぐに知ることができます。SREがインシデントを解決するために何かをするような場合でも、コンテナへのすべての接続の監査があるので、少なくとも何が起こっているのかは知ることができます。

Sysdigが取得する深層データは、問題を理解する際に使用するデータが多いことを意味します。

Sysdigを使用して、解決困難な問題のデバッグと追跡を行いました。

と Staaz 氏は述べています。

例えば、外部のロードバランサーとそのトラフィックを受信するポッドの間でTCPエラーが発生したことがあり、Sysdigはその問題がどこにあるのかを突き止めるのに役立ちました。これまでにCPUが競合するのを見てきましたが、エンドオブザラインのノードでは高い使用率のCPUは無い中で、その上で実行されているポッドのパフォーマンスに問題があることがわかりました。よく見ると、負荷が非常に高くなっていました。Sysdigのダッシュボードを使用して、これらの情報に基づいて、このような種類の識見を得ることができました。

20201208-3.jpg

LogDNAは、Sysdigによる単一のセキュリティ、コンプライアンス、可視化プラットフォームを使用することで、より迅速に問題を解決できるようになりました。Sysdigを使用することで、LogDNAは顧客により良いサービスを提供し、ビジネスを成長させることが可能となったのです。

カテゴリー

ご質問・お問い合わせはこちら

top