AS400 / IBM i の本番障害では、最初の10分で見る順番を間違えると、復旧までの時間が大きく伸びます。夜間バッチ停止、MSGW、CPF/RNXエラー、オブジェクト未検出、ライブラリ違いは、それぞれ見る画面と判断が違います。この記事では、25年以上の現場経験を前提に、本番で慌てないための初動チェックを整理します。
目的は「すぐ原因を断定すること」ではありません。まず、業務を止めるべきか、後続処理を流せるか、担当者へ何を伝えるべきかを判断できる状態にすることです。AS400の障害対応は、ジョブログ、メッセージID、ジョブ状態、ライブラリ、データの順に見ていくと混乱しにくくなります。
本番障害で最初に確認する5つ
| 確認すること | 見るコマンド・画面 | 判断すること |
|---|---|---|
| ジョブが動いているか | WRKACTJOB / WRKJOB | 実行中、待機中、MSGW、異常終了のどれか |
| 何のメッセージで止まったか | DSPJOBLOG / DSPMSG | CPF、RNX、MCH、MSGWの入口を分ける |
| 後続処理に影響するか | JOBQ / SBMJOB / CL | 後続ジョブを流してよいか、止めるべきか |
| ファイル・ライブラリが合っているか | DSPLIBL / WRKOBJ / DSPFFD | ライブラリ違い、権限、ファイル状態を切り分ける |
| 業務影響がどこまであるか | 運用メニュー・締め処理・出荷処理 | 在庫照会、請求締め、出荷確定などの影響を確認する |
MSGWなら、返信より前にジョブログを見る
MSGWは、若い頃ほど「とりあえず終わらせる」方向へ行きがちです。しかし、メッセージによっては適切に返信すれば後続処理を流せる場合があります。逆に、内容を読まずにジョブを終了すると、別途リカバリープログラムや手作業の戻しが必要になることがあります。
MSGWを見たら、まず MSGWでジョブが止まった時の確認手順 と MSGWを早期検知する考え方 を確認してください。夜間バッチで気付くのが遅れる場合は、QSYSOPRや重要ジョブのMSGWを検知してメール通知する仕組みも検討対象です。
CPF・RNX・MCHは同じエラーとして扱わない
AS400の障害調査では、メッセージIDの先頭で入口を分けるだけでも調査時間が短くなります。CPFはファイル、権限、ライブラリ、システム操作に関係することが多く、RNXはRPG実行時のデータや配列、数値変換などに関係することが多いです。MCHはポインターや低レベルの異常として見ます。
| 入口 | よく見る原因 | 詳しい確認先 |
|---|---|---|
| CPF | ファイル未検出、権限、ライブラリ違い、排他 | CPFエラーとジョブログ確認 |
| RNX | RPG実行時エラー、数値変換、配列、データ不整合 | RNX8888の確認手順 |
| MCH | プログラム異常、ポインター、呼び出し関係 | メッセージID・エラーコード索引 |
| MSGW | 応答待ち、夜間バッチ停止、判断待ち | MSGW返信判断表 |
ライブラリ違いは本番障害に見えやすい
本番障害に見えても、実際にはライブラリリスト違い、オブジェクト違い、テスト用ファイル参照が原因のことがあります。特に、保守担当者が変わった直後や、環境移行後、臨時対応後は、DSPLIBL、WRKOBJ、DSPFFDで「どのライブラリの何を見ているか」を確認します。
コマンドを目的から探したい場合は AS400コマンド逆引き、基本操作から整理したい場合は AS400基本操作とコマンド10選 に戻ると確認しやすいです。
業務名とジョブ名を結び付ける
現場では「プログラムが止まった」だけでは判断できません。在庫照会、請求締め、出荷確定のどれに影響するのかを確認して、業務担当者へ伝わる言葉に変換する必要があります。AS400を分かる人がいても、業務が分かる人がいないと復旧判断が遅れます。
- ジョブ名、ユーザー、開始時刻を控える
- 直前の正常終了ジョブと、止まったジョブを分ける
- 締め処理・出荷処理・帳票出力など、業務影響を先に見る
- 再実行する場合は、二重更新や二重出荷がないか確認する
- 判断に迷う場合は、ジョブログと入力データを保全してから相談する
AI・Codexで調査時間を減らす時の注意
ジョブログ、CL、RPGソース、ファイル定義をCodexで整理すると、確認観点の抜け漏れを減らしやすくなります。ただし、本番データ、会社名、ユーザー名、取引先名はそのまま入れないことが前提です。AIは判断者ではなく、調査メモを整理する補助役として使うのが安全です。
社内で安全に使うルールを作りたい場合は、AS400 / IBM i 現場向け Codex実戦研修 で、機密情報を守りながら調査時間を減らす使い方を整理しています。
まとめ
AS400の本番障害では、最初にジョブ状態、メッセージID、後続影響、ライブラリ、業務影響を分けて確認します。焦ってジョブを終わらせるより、復旧判断に必要な情報をそろえる方が結果的に早くなります。この記事を入口に、MSGW、CPF、RNX、コマンド逆引き、Codex活用の記事へ進めるようにしておくと、現場で迷いにくくなります。
関連: ジョブログをどの順番で読めばよいか迷う場合は、AS400ジョブログの見方で、DSPJOBLOGからCPF・RNX・MSGWの原因を追う流れを確認できます。
関連: 在庫照会、請求締め、出荷確定のような業務名から調査する場合は、AS400業務トラブルの調べ方で、ジョブ、プログラム、ファイル、ジョブログへつなぐ流れを確認できます。
関連: RPG/CL小改修を本番反映する前に、AS400本番反映・戻し手順チェックリストで、バックアップ、反映時間、ジョブログ、戻し基準を確認できます。
関連: AS400で帳票・スプールが出ない時の確認手順は、こちらの記事で確認できます。
関連: AS400月次締め・請求締めが終わらない時の確認手順は、こちらの記事で確認できます。
関連: 競合が強い技術カテゴリ対策として、AS400 ACS・5250エミュレータに接続できない時の確認手順|端末・ネットワーク・権限を見る もあわせて確認できます。
関連: 競合が強い技術カテゴリ対策として、AS400権限・監査チェックリスト|ユーザープロファイル・オブジェクト権限・退職者IDを確認する もあわせて確認できます。
関連: AS400現場の競合対策記事として、AS400バックアップ・復旧チェックリスト|SAVLIB・BRMS・RSTLIBで確認すること も追加しました。
関連: AS400現場の競合対策記事として、AS400が遅い時の確認手順|WRKACTJOB・ロック・バッチ負荷・SQLを切り分ける も追加しました。
関連: AS400専門サイトとしての網羅性を高めるため、AS400ジャーナル・コミットメント制御の確認手順|更新事故と戻し判断で見ること も追加しました。
関連: AS400運用・保守の実務対策として、AS400 PTF適用前後のチェックリスト|更新作業で止めないために確認すること も追加しました。
関連: AS400運用・保守の実務対策として、AS400ジョブスケジュール運用チェックリスト|夜間バッチ・SBMJOB・JOBQを整理する も追加しました。
関連: 25年以上の現場経験を反映した実務記事として、AS400 MSGW監視とメール通知の考え方|夜間バッチ停止を早く検知する仕組み も追加しました。
関連: 25年以上の現場経験を反映した実務記事として、AS400問い合わせ受付テンプレート|障害・調査依頼で最初に聞くこと も追加しました。
関連: AS400現場トラブルの網羅性を高めるため、AS400オブジェクトロック・ファイル使用中の調べ方|WRKOBJLCKで止まる原因を見る も追加しました。
関連: AS400の保守費用・契約・AI活用を検討する場合は、AS400保守契約を見直す時のチェックリスト|障害対応・改修・引き継ぎ範囲を見る も確認してください。
関連: AS400運用・障害対応の入口として、AS400トラブル逆引き一覧|症状からMSGW・ジョブログ・帳票・FTP・権限の記事を探す も追加しました。
関連: AS400運用・障害対応の入口として、AS400障害報告書テンプレート|原因・影響・対応・再発防止を現場目線で整理する も追加しました。
関連: AS400現場経験を補強する記事として、AS400で実際によく相談されるトラブル10選|25年以上の現場経験から見る初動 も追加しました。
