ユーザー事例

Pike13

Pike13

COMPANYDETAILS

フィットネス施設向けのクラウドベースのクライアント管理ソフトウェアの開発、提供

課題

  • 監視ツールの設定と保守に時間と労力を費やしている
  • コンテナメモリ、CPU、ネットワークパフォーマンスなどのAWS上のアプリケーションの可視性が欠如している
  • トラブルシューティングに時間がかかっている
  • トラブルシューティングに必要な情報が不足している

SYSDIGの利点

  • インフラストラクチャ全体のサービスを自動的に監視することができる
  • 異常が発生した場合に即座にアラートを受信することができる
  • 簡単なオンボーディングとすぐに利用可能なダッシュボードで、ユーザーの生産性を向上することができる
pike13-1.jpg

成功への鍵

クラウドベースのクライアント管理ソフトウェアを提供するPike13は、ジムやヨガスタジオ向けに日常の管理業務を処理するためのシステムを提供しています。
オールインワンプラットフォームにより、フィットネス事業者が行っている給与計算やスケジューリング、関係者間のやり取りなど、店舗スタッフと顧客のどちらの管理も可能にしています。
Pike13は会員制ビジネス向けのソフトウェア製品の中で最高級ランクに位置づけられており、世界中のユーザーから信頼されています。
利用するソフトウェアのパフォーマンスと可用性は、収益の創出と顧客維持にとってとても重要な要素です。
アプリケーションが落ちてしまった場合、ジム、ヨガスタジオのスタッフだけでなく顧客にも影響を与えてしまい、最悪の場合、通常どおりの業務を行うことができず、施設を利用できなくなってしまう可能性もあります。
そのため、ソフトウェアが確実に動いてくれることが必須となっています。

モノリシックアプリケーションからマイクロサービスへの変換を可能に

Pike13は当初、ソフトウェアアプリケーションをモノリシックなアプリケーションとして開発し、2012年のリリース以来使用していました。
モノリス上に構築されたアプリケーションの開発、展開、およびデバッグは困難で時間がかかっていました。
ソフトウェアの配信を加速するため、Pike13はプラットフォームの一部にマイクロサービスを採用しました。
一部のアプリケーションをAmazonElastic Container Service(ECS)に移行し、俊敏性とスピードを強化しました。
当初、担当者は、コンテナ環境のロギングとモニタリングにAWSのデフォルトの機能であるAWSグラフとAWSCloudWatchを使用していました。
しかし、これらのツールでは、コンテナメモリ、CPU、ネットワークパフォーマンスなどPCI準拠の企業に必要とされている情報を取得することができませんでした。

プロアクティブ・アラートによる強固なカスタマー・エクスペリエンス

2015年のSysdig導入以来、Pike13の開発者やDevOpsチームは簡単な設定とメンテナンスだけで、Amazon ECSベースのコンテナ化されたアプリケーションとそれに関連したサービスの健全性を把握することが出来ています。
DevOpsチームは、Sysdigを使ってアプリケーション環境を継続的にチェックしており、問題になる前に対処できるよう、異常も含めて確認しています。
ソフトウェアをデプロイする際には、メモリとCPUのパフォーマンスをSysdigで調べることで、デプロイメントが期待通りに動作しているかどうかを瞬時に確認しています。

また、Pike13は問題を見越して警告するように設定されているSysdigアラートを高く評価しており、Pike13社DevOpsエンジニアであるThyrus Gorgesは、予期しないデータベースクラッシュのSysdigMonitorを用いた特定と解決方法について以下のように述べています。

以前にMongoDBのデータベースがクラッシュするという問題が発生し、お客様に迷惑をかけてしまったことがありました。
そのためSysdigにアラートを設定して、問題の原因となった状態を監視しました。
問題が再び発生した時、Sysdigからの通知によって、問題が発生していることを知ることが出来ました。
すぐに問題が発生したことを把握できたことによって、クラッシュを回避するためのダウンタイムを設けることができ、お客様に影響を与えずに解決することが出来ました。
Sysdigが事前に知らせてくれていなければ、そのように対応できなかったと思います。

pike13-2.png

Pike13では新しいアプリケーションをデプロイする際にも新しくデプロイされたアプリケーションが予期せぬ影響を与えていないかどうかSysdigで確認しています。

より多くの人が利用するシステムを展開する際には1秒単位の粒度での対応が必要になります。
APMソフトウェアなどの他のツールでは、データが表示されるまでしばらく待つ必要があり、場合によっては数分かかることもあります。
しかしSysdigの場合は、ログイン後10秒ほどでデータを取得することが出来、何かあったときにすぐにわかるようになっています。

とGorges氏は話しています。

生産性向上のための時間短縮

彼がSysdigで最も気に入っていることの1つに、セットアップと保守が簡単なことを挙げています。

Sysdigはエージェントをインストールすれば完了です、ただそれだけです。
当初、AWS CloudWatchやその他のAWSグラフを使用していましたが、独自のダッシュボードを作成する必要があり、それらのツールを監視するためだけにさらに多くの作業が必要となっていました。
一方、Sysdigは、ElasticSearchや、RedisやMongoDBなど、すでに持っている他のデータベースで使用できるダッシュボードを自動的に提供してくれました。
また、AWSアカウントにフックするためのAmazonRDSとPostgresのデータも取得することが可能です。
それらのデータはすべてSysdig内で管理されており、すぐに見ることが出来ます。
独自のダッシュボードを作成するのは大変な作業なので、本当に素晴らしい機能だと思っています。
それに加えて、Sysdigダッシュボードによって自分たちが何を見るべきかを知ることが出来ました。
新しいコンテナ環境でダッシュボードを作成するのは初めてでしたが、Sysdigを導入したことによって、簡単に始めることができました。

と述べています。

合わせて、

Sysdigのオンボーディングプロセスは簡単です

とGorges氏は付け加えました。

ユーザーにログインしてもらい、仕組みを簡単に説明します。
99%の人はメモリやCPUの仕組みを知っているので、すぐに理解してもらえます。
なのでダッシュボードを見せれば、それでだけで完了です。
新規開発者への導入に最も時間がかからないツールであると考えています。

pike13-3.png

3-4倍速いトラブルシューティング

Sysdigはユーザーからカーネルへのアクティビティの重要なメカニズムである「システムコール」の情報により、深いレベルのシステム情報を提供しています。
Sysdigユーザーはシステムコールの情報によって、カーネルレベルで発生するすべての相互作用を把握することができ、トラブルシューティングに必要な監査証跡をキャプチャして保存することが可能となっています。

Gorges氏が以前、通常は数分で完了するバックグラウンドプロセスの開始に30分かかってしまう事象に直面した際、Sysdigキャプチャツールを使用することで、実行中のプロセスに何が起こっているのかをすぐに確認することが出来ました。

このようなことから

Sysdigのキャプチャ機能は素晴らしいです

と彼は述べています。

システムコールは、プロセスに問題があるかどうかを知るために必要な情報をすべて教えてくれます。 1つがハングしている場合は、スタックしている正確なコールを見ることができます。
これは、システムコールを使用する際に開かれるブラックボックスのようなものです。
Sysdigを使用することで、問題がどこにあるかを簡単に診断することができます。
たとえば、インスタンスが動作している場合、それが運用レベルの問題なのか他の問題なのかを簡単かつ迅速に判断できます。
Sysdigのダッシュボードをクリックすると、何が起こっているのか確認することが出来ます。
グラフを検索して適切なインスタンスを見つけ、インスタンスにログインして何が起きているか把握する必要はありません。
問題を把握するために多くの調査を行う必要がなく、すぐにどう対処すべきか把握できることで、時間を大幅に節約することが出来ます。
Sysdigがなければ、複数のデータベースに可視性を分散させることになり、デバッグの問題が起きた場合にはとても面倒な状況になっていたと思います。
アプリケーションレベルのデータを提供してくれるツールは他にもありますが、必要なデータの情報レベルが統一されておらず、Sysdigほど使いやすいものではありませんでした。
その上、Sysdigは、問題の原因をより早く特定するのに非常に有用です。
他のツールを使用した場合、手動でのデバッグには3〜4時間多くかかってしまっていたと思います。

と彼は振り返りました。

今後のインフラ計画と費用の最適化に関する見通し

Sysdigによって、ネットワークトラフィックを監視し、使用状況を理解し、正確にインフラストラクチャを調整することができるようになります。
ネットワークトラフィックの増減を確認できると、企業はインフラストラクチャの規模を予測することができます。Pike13では、システムの利用状況を把握することで、規模と効率のバランスを取りながら、コスト削減のためにクラウドリソースを調整しています。

Sysdigのおかげでスイートスポットを理解し、より良い情報に基づいた意思決定ができるようになり、最終的には収益を向上させることができました。

とGorges氏はSysdigを評価しています。
Sysdigは、Pike13のマイクロサービス環境の不可欠な部分であり、チームの時間を節約し、イノベーションを加速し続け、顧客が期待するソフトウェアの信頼性を確実なものになるよう支援しています。

Translated by Shoko Sekiya

カテゴリー

ご質問・お問い合わせはこちら

top