アクション設定

"アクション"とは、監視設備側からのメール送付や、運用への連絡のことを指します。アラート発生時、ワーニング発生時、及びリカバリ確認時のアクションを設定します。

【参考】

複数の内部監視が同時刻に実行され、監視対象機器との接続に失敗した場合(エラーコード: XXXEXXX)、アクション実行が1つにまとめられます。

1. 「アラート発生時のアクション設定」、「ワーニング発生時のアクション設定」、「リカバリ確認時のアクション設定」の「修正」をクリックして、詳細設定画面を表示させます。


[アラート発生時のアクション設定]
「アラートアクション詳細設定画面」の項目を設定し、「確認」をクリックします。

[1 アラートアクション基本設定]

設定項目設定内容
除外エラーコード

アクションを実行しないエラーコードを設定
※ 直接入力、または「エラーコード一覧」をクリックして表示されるエラーコードの一覧から、対象のエラーコードをクリックして入力します
※「 エラーコード一覧」について詳しくは、「エラーコード一覧の例(F_PING監視)」をご覧ください

エラー無視回数

アラートを検知した際に無視する回数を直接入力、またはプルダウンメニューから選択
※「 2」を設定した場合、2回目までのアラート検知は無視され、アクションは実行されません
(メール送付はありません)

アラートアクション実行回数

アラートを検知した際にアクションを実行する回数を入力、またはプルダウンメニューから選択
※「 1」を設定した場合、アラートを最初に検知したときにアクションが実行されます。「5」を設定した場合、アラートが継続している間、5回までアクションが実行されます
※ 推奨値は1回です

  • エラーコード一覧の例(F_PING監視)

【参考】除外エラーコードについて

除外エラーコードは、該当の監視で特定のエラーによるアクション(メールの通知や運用対応)を実行しない場合に設定します。
アクションは実行されませんが、エラーは検知しているため、障害履歴にエラーを検知した結果が残ります。


(例1)該当の監視で、E001エラーによるアクションを実行しない


上記のように「E001」のエラーコード「-1」を入力します。
設定した監視で「E001エラー」が検知されても、アクションは実行されません。
その他のエラー(W010やE010)を検知した場合は、アクションを実行します。


(例2)該当の監視で、E001エラーとE099エラーによるアクションを実行しない


上記のように、「E001」のエラーコード「-1」と「E099」のエラーコード「-99」を「; (セミコロン)」で区切って入力します。
設定した監視で「E001エラー」と「E099エラー」が検知されても、アクションは実行されません。
その他のエラー(W010やE010)を検知した場合は、アクションを実行します。

【参考】エラー無視回数とアラートアクション実行回数

障害を検知した場合は、エラー無視回数、アクション実行回数の順で実行されます。
無視回数に「2」、実行回数に「3」を設定した場合、障害を検知してから2回目までを無視し、以降3回(発生時から数えて5回目の監視)まで、設定したアクションを実行します。

【参考】ワーニングとアラート

ワーニングとアラートの閾値を設定できる監視(トラフィックの閾値、CPU使用率の閾値など)と、設定できない監視(プロセス監視など)があります。
閾値を設定できる監視では、「監視詳細設定画面」で設定します。閾値を超えるとアクションを実行します。
閾値が設定できない監視では、障害を検知すると、ワーニングとアラートそれぞれの無視回数、実行回数などを判断し、アクションを実行します。

【参考】閾値のない監視でのエラー無視回数とアクション実行回数の動作

エラー無視回数とアクション実行回数は、以下のように処理されます。

  1. 「 アラート発生時のアクション」のエラー無視回数とアラートアクション実行回数を確認します。
  2. アラートとして出力する設定の場合、アラートとして出力し、終了します。
  3. アラートとして出力しない設定の場合、「ワーニング発生時のアクション」を確認します。
  4. 「 ワーニング発生時のアクション」のエラー無視回数とアラートアクション実行回数を確認します。
  5. ワーニングとして出力する設定の場合、ワーニングとして出力し、終了します。
  6. ワーニングとして出力しない設定の場合、何もせずに処理が終了します。

[設定例]
アラート発生時のアクション設定

  • エラー無視回数:1回
  • アクション実行回数:1回

ワーニング発生時のアクション設定

  • エラー無視回数:無視しない
  • アクション実行回数:1回

この場合、1から5までの処理が実行されます。初回検知時はワーニングを出力し、2回目(継続してエラーの場合)の検知時はアラートを出力します。

[2 アラートアクション詳細設定 - メールアクション設定]

設定項目設定内容

アラート発生時にメールを送信する

アラート発生時にメールを送信する場合は、項目をチェック
※ メールの送信先は「メールTO」、メールの件名は「メール件名」、メールの本文は「メール
本文」に入力します

メールTO

アラート発生時にメールを送信するメールアドレスを入力
※「 (; セミコロン)」で区切って、複数のメールアドレスを入力できます
※ 最大255文字です。 

メール件名

アラート発生時に送信するメールの件名を入力
※ 任意に変更できます
※ 変更の必要がない場合は、デフォルト値を利用してください

メール本文

アラート発生時に送信するメールの本文を入力
※ 任意に変更できます
※ 変更の必要がない場合は、デフォルト値を利用してください

【参考】

「メール件名」と「メール本文」のデフォルト値は、以下のとおりです。

  • _#DefAlertSub_

以下に示す形式で件名が表示されます。

192.168.0.2(testnode_001)-PING【Alert】
  • _#DefAlertBody_

以下に示す形式で本文が表示されます。

Alert has been detected.
Response time alert value reached.(PNG-W006)
Detected Date:yyyy/mm/dd hh:mm:ss
Node:192.168.0.2(testnode_001)
Other IP :192.168.0.3
Type:Ping
ID :123456
Message:10ms

【参考】アラートアクションで使用可能な変換文字列

アラート、ワーニング、リカバリのアクション実行時に送付されるメールでは、「監視コントロールパネル」で定義された変換文字列を利用できます。
メールで使用できる文字列と内容は、以下のとおりです。これらを組み合わせることで、メールに表示させる内容を設定できます。
デフォルト設定(_#DefAlertSub_や_#DefAlertBody_)で定義されている情報と異なる項目が必要な場合に、使用してください。
※ 変換文字列を任意に定義することはできません。

変更文字列名称内容
_IP_Pアドレス監視を行っている対象のIPに変換されます
_NAME_サーバ名称監視対象のサーバ表示名称に変換されます
_MODULE_監視項目障害を検知した監視項目名に変換されます
_ALTMOD_監視名称ユーザが設定した監視名称に変換されます
_YMD_最新日時障害が発生した最新の日時に変換されます
_UTIME_最新日時

障害が発生した最新の日時(UNIXタイムスタンプ)に変換されます

_ERRCD_エラーコード障害に対応したエラーコードに変換されます
_ERRCMT_エラーコメントエラーコードに対応したエラーコメント(定型文)に変換されます
_ERRMSG_エラー内容障害内容に変換されます
_REPORT_前回のエラー内容前回のエラー内容(メールの本文部分)に変換されます
_PS_プロセス一覧

対象機器にプロセス監視を行っている場合、取得したプロセス一覧に変換されます

_NETSTAT_ListenPort一覧

対象機器に内部Port監視を行っている場合、取得したlistenport一覧に変換されます

_MAILADD_宛先メールアドレスTOに設定されたメールアドレスに変換されます
_ECNT_エラーカウント数アラート発生からのアラート回数に変換されます
_SYMD_発生日時一連の障害が起こった最初の日時に変換されます
_CLTMID_監視ID対象の監視項目に振られたIDに変換されます
_ALTIP_別IP設定している別IPに変換されます

[例]アラートメールの本文を変更する場合
サーバ名、IPアドレス、監視ID、監視項目、エラーコード、検知結果を表示させる場合は、下記の設定を行います。

上記のように、表示させる各項目の変換文字列を入力します。
例えば、サーバ「testnode_002」のログ詳細監視で"err"という文字を含んだ1行(20140910err)を検知した場合は、以下のように変換されます。

サーバ名;testnode_002
IPアドレス:192.168.0.4
監視ID:234567
監視項目:ログ詳細
エラーコード:LGM-W010
検知結果:A:TAG1:20140910 err

[2 アラートアクション詳細設定 - 監視連動アクション設定]

「監視連動アクション」は、検知した結果をトリガとして、任意の監視を開始、停止、及び再実行できます。
「監視連動アクション設定」をクリック、または「アラート発生時に他の監視の停止、開始を行う」をチェックすると、設定項目が表示されます。

設定項目設定内容

アラート発生時に他の監視の停止、開始を行う

アラート発生時に他の監視を開始、停止、または再実行する場合は項目をチェック
※ 項目をチェックすると、設定項目が表示されます

グループアラート発生時に他の監視を開始、停止、または再実行するグループを選択
サーバアラート発生時に他の監視を開始、停止、または再実行する監視対象サーバを選択
監視

アラート発生時に開始、停止、または再実行する監視をプルダウンメニューから選択
※ アラート発生時の動作(開始、停止、再実行)を選択します

[ワーニング発生時のアクション設定]

「ワーニングアクション詳細設定画面」の項目を設定し、「確認」をクリックします。

各項目について詳しくは、「[アラート発生時のアクション設定]」をご覧ください。

【参考】

「メール件名」と「メール本文」のデフォルト値は、以下のとおりです。

  • _#DefWarnSub_
    基本的な表記は「_#DefAlertSub_」と同様です。件名の「192.168.0.2(testnode_001)-PING【Alert】」が「192.168.0.2(testnode_001)-PING【Warning】」となります。
192.168.0.2(testnode_001)-ping【Warning】
  • _#DefWarnBody_
    基本的な内容は、前述の「_#DefAlertBody_」と同様です。メール1行目の「Alert has been detected.」が「Warning has been detected.」となります。

Warning has been detected.
Response time alert value reached.(PNG-W006)
Detected Date:yyyy/mm/dd hh:mm:ss
Node:192.168.0.2(testnode_001)
Other IP :192.168.0.3
Type:Ping
ID :123456
Message:10ms

[リカバリ確認時のアクション設定]

「リカバリ確認アクション詳細設定画面」の項目を設定し、「確認」をクリックします。

各項目について詳しくは、「[アラート発生時のアクション設定]」をご覧ください。

【参考】

「メール件名」と「メール本文」のデフォルト値は、以下のとおりです。

  • _#DefRcvrSub_
    基本的な表記は「_#DefAlertSub_」と同様です。件名の「192.168.0.2(testnode_001)-PING【Alert】」が「192.168.0.2(testnode_001)-ping【Recovery】」となります。
192.168.0.2(testnode_001)-ping【Recovery】
  • _#DefRcvrBody_
    基本的な内容は、前述の「_#DefAlertBody_」と同様です。メール1行目の「Alert has been detected.」が「The following problem has been recovered.」となります。

The following problem has been recovered.
---Problem Messages------
> Response time alert value reached.(PNG-W006)
> Detected Date:yyyy/mm/dd hh:mm:ss
> Node:192.168.0.2(testnode_001)
> Other IP :192.168.0.3
> Type:Ping
> ID :123456
> Message:10ms

また、リカバリ確認時のメールアクション設定でも、前述の「変換文字列」を使用できます。

【参考】

アラート、ワーニングのアクションが設定されておらず、リカバリだけアクションが設定されている場合は、リカバリを検知してもアクションが実行されません。