エンジニアリング機能

障害ハンドリング

監視サービス、ジョブ管理サービス、インシデントAPI、及びメール取り込みオプション経由で検知したアラートを契機に、以下の対応を実施します。
運用ルールが定められている場合は、運用ルールに則り、対応します。

1システム正常性確認お客様があらかじめ用意したシステム正常性確認手順書を用いて、システムが提供すべき機能が提供されていることを確認します
2障害発生通知害発生日時及びシステム正常性確認の結果をメール、または電話で連絡します
3障害調査

障害状況を調査します。障害状況によっては、お客様にエスカレーションする場合があります

  • 障害調査の例
    • システム論理構成図にもとづき、システム構成を確認します
    • 機器のステータスやログを確認します
    • システム論理構成、及び機器のステータスやログを基に、障害箇所を特定します
    • パフォーマンスの低下が見受けられる場合は、機器のステータスやログを基に、パフォーマンスの低下原因の調査を行います
    • ディスク使用率のしきい値超過が見受けられる場合は、機器のステータスやログを基に、ディスク使用率を圧迫している原因の調査を行います
    • 保守契約情報にもとづき、外部ベンダに調査を依頼します
4障害復旧

障害調査の結果にもとづき、障害復旧を試みます。障害復旧に際して、パッチの適用やソフトウェアのバージョンアップなど、システム設計の変更を伴う作業が必要と認められた場合は、暫定措置による障害復旧を優先します。システム設計の変更を伴う作業については、別途、センター個別運用オプションをご契約いただく必要があります

  • 障害復旧の例
    • プロセスの停止及び起動や、サーバの停止及び起動により、メモリ空間の解放、プログラムや設定情報の再読み込みを行います
    • 冗長構成のシステムの場合は、スタンバイ系でのシステム稼働に切り替えます
    • ディスク使用率を圧迫しているファイルの退避、圧縮、または削除を行います
    • 設定情報の破損が見受けられ、正規の状態への復旧が可能な場合は、設定情報の戻し作業を行います
5障害復旧確認障害復旧後にシステム正常性確認手順を実施し、システムの障害が復旧していることを確認します。また、障害ハンドリングの過程で、異常を示す他のアラートを受け付けていないかを確認します
6障害対応報告

以下について、メール、または電話で報告します

  • 障害調査、及び障害復旧の中間報告
  • 障害復旧時間
システム稼働状態確認

お客様からのメールや電話、及び「UOMポータル」からの障害申告にもとづき、以下の対応を実施します。

1システム正常性確認お客様があらかじめ用意したシステム正常性確認手順書を用いて、システムが提供すべき機能が正常に稼働していることを確認します
2アラート出力検知状態確認異常を示すアラートを検知していないか確認します
3サービス設備稼働状態確認ご契約いただいているIIJサービス、及び弊社のサービス設備で障害が発生していないかを確認します
4調査結果報告上記の各確認結果をメール、または電話で報告します。いずれかの確認で異常が見受けられた場合は、障害ハンドリングの障害調査を開始します
管理者権限貸し出し対応

弊社で運用対象ノードの管理者権限を管理している場合は、お客様からの依頼にもとづき、所定の管理者権限を一定期間お客様に貸し出します。貸し出し期間は、1回の申請で、最長1週間です。

ハードウェアやソフトウェア保守

お客様の保守契約にもとづき、ハードウェア、及びソフトウェアの調査を行います。必要に応じて、障害箇所を交換します。
運用コンサルティングで保守契約に必要な情報を、弊社で預かります。保守契約はお客様にあらかじめ締結していただき、弊社エンジニアから保守契約先への連絡が許可されている必要があります。