AS400 / IBM i の障害対応後は、復旧して終わりではありません。なぜ起きたのか、どこに影響したのか、何をしたのか、再発防止として何を変えるのかを残すことで、次の障害を減らせます。
障害報告書に入れる項目
| 項目 | 書くこと | 目的 |
|---|---|---|
| 発生概要 | 発生日時、検知方法、対象業務 | 何が起きたか分かる |
| 影響範囲 | 利用者、帳票、バッチ、外部連携 | 業務影響を説明する |
| 原因 | MSGW、CPF/RNX、ロック、権限など | 技術原因と運用原因を分ける |
| 対応 | 確認、返信、再実行、戻し | 何をしたか残す |
| 再発防止 | 監視、手順、教育、資料化 | 次回を減らす |
技術原因と運用原因を分ける
障害報告では、ジョブがMSGWで止まった、CPFエラーが出た、ロック待ちになったという技術原因だけでなく、なぜ検知が遅れたのか、なぜ手順がなかったのか、なぜ担当者しか分からなかったのかも整理します。
再発防止は実行できる形にする
「注意する」だけでは再発防止になりません。MSGW監視を追加する、再実行手順を作る、問い合わせテンプレートを変える、月次点検に入れる、若手へ教育するなど、実行できる項目にします。
初動は AS400本番障害の初動チェックリスト、問い合わせの集め方は AS400問い合わせ受付テンプレート、運用改善は AS400運用改善ロードマップ を参照してください。
Codexで報告書のたたき台を作る
Codexには、匿名化した発生時刻、対象業務、確認項目、対応履歴を渡すと、報告書のたたき台を作りやすくなります。実データや顧客名は入れず、最終確認は人が行います。
関連: AS400業務トラブルの具体例として、AS400在庫差異の調べ方|在庫照会・入出庫履歴・締め処理から原因を見る も追加しました。
関連: AS400業務トラブルの具体例として、AS400請求金額不一致の調べ方|請求締め・売上・消費税・再計算で見ること も追加しました。
関連: AS400業務トラブルの具体例として、AS400出荷データ二重送信・未送信の調べ方|出荷確定・EDI・FTP連携を確認する も追加しました。
