SCSKのHPCワンストップサービス

SCSKでは構成検討、提案から導入構築、運用保守までワンストップで対応し、お客様の課題を解決します。

【構成検討】機種選定、課題解決提案、【導入構築】システム構築、設置・テスト、【運用保守】マルチベンダサポート、ハードウェア障害監視
最適なシステムの提案をはじめ、構築から保守までをトータルサポート

構成検討

機種選定

  • お客様の用途や予算に合わせて最適な構成を提案します。
  • MPI、高速ネットワーク(InfiniBand etc.)、高速ストレージ、GPGPU、ジョブ管理システム、コンパイラ、プリポストなど、広範囲で高度な要件に対しても、HPC専任プリセールスが選定をサポートします。

課題解決提案

  • コマンドラインではなくWEB GUIからジョブを投入したい、リモートでシステムを利用したい、認証を統一したい、ネットワーク環境を改善したい、サーバー室の電源やスペースが足りないなど、お客様ごとのさまざまな課題や要望に対して、当社知見を踏まえた解決策をご提案します。

導入構築

システム構築

  • お客様ごとに制約や設定項目のヒアリングを行い、クラスタシステムを構築します。クラスタシステムを初めて利用されるお客様やLinuxに詳しくないお客様のためにSCSK推奨設定を用意しています。
  • システム構築は弊社整備センターで行い、Linpack等のベンチマークソフトで動作テストと初期不良の洗い出しを済ませてからお客様先へ出荷します。

設置・テスト

  • 複数ラックにまたがるような大規模なクラスタシステムでも、搬入から設置、配線まで、専任のエンジニアが効率的かつ安全に作業を行います。
  • 設置完了後にあらかじめ定めた動作テストを行い、お客様に正常性を確認いただいた上でシステムを引き渡します。
  • システムの引き渡しに際しては、起動停止の手順やジョブ管理ソフトの利用方法などをご説明します。

運用保守

マルチベンダサポート

  • SCSKのHPC構築・保守サービスは、複数ベンダにわたるハードウェアやソフトウェアのサポートを一つの窓口で提供します。お客様自身が直接ベンダとやりとりしながら切り分けてきた煩わしい障害対応を、SCSKのHPC専任サポートチームが代行し復旧まで支援します。
  • 構築を担当したSEと連携して早期の問題解決を導くとともに、お客様の負担を減らすログ一括収集ツールのご提供や、お客様環境にリモート接続して障害切り分けのオペレーションを代行するといったオプションメニューも用意しています。
【図】SCSKのHPC専任サポートチームがすべての障害・質問を一括受付:質問への回答、障害原因の切り分け、ベンダサポートとの調整代行、エンジニアによる復旧支援、現地対応エンジニアの派遣など

ハードウェア障害監視

  • HPE iLOやDELL iDRACなどのBMC(Baseboard Management Controller)とZabbixを連携させたハードウェア障害監視サーバーを構築します。
  • 障害の早期検知によりデータロストや利用停止期間の長期化を避けることができます。
ZabbixによるHPCシステム監視・動作イメージ