AS400 / IBM iの現場でよく相談されるトラブルに、夜間バッチ停止と本番プログラムのアベンドがあります。特にMSGWのまま止まっている状態に気づくのが遅れると、後続処理、帳票、出荷、請求、在庫更新に影響します。
監視サービスを使う会社もありますが、現場ではMSGWや重要ジョブを自前で検知してメール通知する仕組みを作ることもあります。大切なのは、どの状態を検知し、誰へ、どの文面で、何分以内に知らせるかを決めることです。
早期検知したい状態
| 対象 | 見る状態 | 通知理由 |
|---|---|---|
| MSGW | 重要ジョブがメッセージ待ち | 返信しないと後続処理が止まる |
| 夜間バッチ | 予定時刻を過ぎても終了しない | 朝の業務開始に影響する |
| 異常終了 | ジョブログにCPF/RNX/MCH系メッセージ | 原因調査と再実行判断が必要 |
| QSYSOPR | 重要メッセージが未確認 | システム側の警告を見落とさない |
| OUTQ | 帳票が溜まっている | 出力停止やプリンター異常を検知する |
通知に入れるべき情報
- 発生日時
- ジョブ名、ユーザー、ジョブ番号
- メッセージIDとメッセージ本文
- 対象ライブラリやプログラム
- 一次確認リンクや確認コマンド
- 返信してよいか、担当者判断が必要か
通知文が「エラーです」だけでは、担当者は結局ログインして一から調べることになります。メール通知には、ジョブ、メッセージID、発生箇所、初動確認の観点を入れると、調査時間を減らせます。
MSGW返信は慎重に扱う
MSGWは、適切に返信すれば後続処理を流せる場合があります。一方で、意味を理解せずに終了させると、別途リカバリープログラムや手作業が必要になることがあります。若手や一次対応者には、勝手に返信せず、メッセージID、ジョブログ、業務影響を確認してから判断するルールを徹底します。
MSGWの基本は AS400 MSGW監視とメール通知、本番障害の初動は AS400本番障害の初動対応も確認してください。
AIで通知後の調査を速くする
通知後のジョブログ整理や障害報告書の下書きには、AIやCodexも使えます。メッセージID、発生ジョブ、直前の処理、影響範囲、確認すべきファイルを整理する用途に向いています。ただし、会社名、ユーザーID、顧客名、実データは必ずマスキングしてください。
安全な使い方は AS400 / IBM i 現場向けCodex実戦研修も参考にしてください。
まとめ
AS400のMSGW・夜間バッチ停止は、早期検知と通知設計が重要です。何を検知し、誰に、どの情報を送り、どこまで一次対応してよいかを決めることで、本番障害の影響を小さくできます。
