2024年7月20日

BSoD

久々に聞いた"Blue Screen of Death (BSoD)"。 世界的に同時多発的にBSoDが発生して、様々なサービスが停止に追い込まれたらしい。昨日はほぼ一日中移動中で、時々パソコンを広げたりしていましたが、自分のパソコンは勿論、移動中のサービスでも特にトラブルに遭遇しなかったのは運が良かったからなのかな。航空関係では、JALの予約システムが影響を受けたみたいですが、ANAは大丈夫だったのかなぁ。

現時点で原因は特定されていて、それは米国のセキュリティベンダーのCrowdStrike社の「csagent.sys」ファイルがBSoDを起こすらしい。何か、昔のDOS時代によく有った話だよなぁ(苦笑)。CONFIG.SYSに記載してロードするドライバーや常駐ソフトを更新すると、それが原因で起動出来なくなったりエラーが発生。その場合は、DOS起動用のディスケット(当時はまだUSB何て無い(キリッ!))で起動して、問題のあるCONFIG.SYSを修正したり、そのドライバー類を削除・以前のバージョンにロールバックしたりして難を逃れたものです。Windowsの場合はどうするんだろうか。WinPEで起動して、そのcsagent.sysを以前のバージョンにロールバックするしか無いのかなぁ。でもWindowsの場合、複数の場所に保存していて、一箇所だけでは問題のあるバージョンが上書きされてしまうこともあるからなぁ。大変そう... 

今回のトラブルは何か条件が合って、そこで今回のcsagent.sysがロードされるとBSoDが発生するんだろうけど、メーカーのテストをなんですり抜けたんだろうか。理由は不明だけれど、結構この手の「何でこんな単純な問題をエスケープするんだ」というのは開発やっていると結構経験するんですよね。開発中は、何度もテストするんだけれど、最終製品としてリリースされるとどうしてもそのテスト環境とは異なる条件や環境が存在するわけですし。特定製品との組合せで発生するとか、Windows関係だと実装されているランタイムのバージョンとか。場合によっては、ファームウェアのバージョンとかも関係することも。あぁ、後はロードされる順番とかも影響する場合がありますね。自分が一番記憶に残っているのは、Intelが出したストレージマネージメントのRST (Rapid Storage Technology)、今はISRT(Intel Smart Response Technology)と言っているのかな。要するに、HDD/SSDへのアクセス管理のドライバー何だけれど、ストレージアクセス故に色々とやらかしくれました。データロストだったり、HDD/SSDアクセスは問題無いのにDVDだとエラーに成ったりとか。お客様へ何度頭を下げたことか(Intelの性なのにプンプン)。

今回レポートされているところでは、オフィスPCは勿論、自動販売機だったりPOS端末だったり、ちょっと予想外のところにもWindowsが侵食している事が可視化されてしまいましたね。一般にパソコンで利用されているWindowsとは別に、そういう端末系で使用するWindows IoTが影響を受けたのかな。IoT系は一度組み込んだら、その後は長期間そのまま利用するのが前提だから、一台一台修復するのは大変だろうなぁ。一般的にはネットワーク経由で更新ソフトとか送り込んでメンテナンスするんだろうけど、今回はその為に必要なWindows IoTの起動も出来ない状況だろうし。多分パッチ込みのブータブルなUSBを準備して、それを挿入して対象機をUSBから起動してパッチ適用。その後本体を起動して動作確認という、どう見ても1台辺り何十分も掛かりそうだから、人海戦術で行くしかないのに最近は人手不足だし。配布するときは一斉に配信できるから一瞬なんだけれど、修正する場合は1台1台手当しないといけないというのジレンマですよね。昔の記憶が色々蘇ってきて、ちょっと他人事とは思えないのが悲しい(苦笑)。

0 件のコメント:

コメントを投稿