みずほ銀行のATMトラブルの原因は、週末に行われたデータ更新によるシステム過負荷が原因という記事。 複雑な条件が重なった例外処理のエスケープではなく、事前確認した以上に28日にシステム負荷が発生して、それによって機能の一部制限が大規模に発生したという、ちょっと笑えない話。
記事によれば、先月末には定期預金口座のデータ更新作業(45万件)と月末処理が重なり、27日は45万件+15万件で問題なかったものの、28日は月末処理が10万件増えて、45万件+25万件の処理がシステム過負荷を招いたのが原因とのこと。月末処理が増えたことで、システム上の空き領域が不足したので、システムの機能制限をする事で空き領域を増やそうとしたところ、それがATMの機能制限になってしまったらしいけれど、それならそれでカードや通帳を吸い込む前に、「ただいま機能制限中」とか表示して取り扱いを事前に保留するとか出来ないものだろうか。
実は、最近実際の仕事で似たような事に遭遇しているので、この原因理由を聞いてちょっと他人事と思えない(笑)。コンピューターの仕組みを一言で言うのは難しいけれど、メモリー上に展開されているデータを、一つ一つ処理していくのですが、その時にどれだけメモリー上に展開出来るかでシステムパフォーマンスは大きな影響を受けます。ですから、より大容量のデータ処理が必要なアプリケーションは、出来るだけ多くのメモリーを占有しようとするけれど、そうなるとそのアプリが起動している間は他のアプリや最悪の場合OS辞退が動かなくなってしまうので、どれだけ占有しても良いとか、どの様に処理するのかとか、色々仕組みを入れないと使えないアプリになってしまう。アプリ自身の作り方の問題でもあるし、そう言うアプリを効率良く動作させるためのOSのデザインにも起因する問題。
空くまで記事を読む範囲だけなので正確では無いのかもしれないけれど、システム過負荷になった時に、何でその原因である月末処理やデータ更新作業の処理データ量や処理スピードを制限するのでは無く、他の機能制限でシステムリソースを開けようとするデザインなんだろうか。それだけ、それらの処理に関するタスクの優先順位が高いのかもしれないけれど、その処理しているタスク以外の機能制限をするというのは、そのタスクでどうしようも無い場合の、本当に最後の手段に成るんじゃ無いだろうか。例えば、データ処理に一回1万件を読み込んでいたなら、それを半分にするとか、色々やり方はあると思うんですよね。まぁ、28日中に処理完了するためには、どうしても処理速度を下げることは出来ず、それだけのデータ読み込みが必要なのかもしれないけれど、それでも優先順位としては直接利用者に影響があるATM関連の機能制限というのは、最後の手段じゃ無いかと思うんですけどね。まぁ、今回も高い授業料を払うことになったみずほ銀行ですが、いつかその授業料に見合うだけのリターンをして欲しい。
0 件のコメント:
コメントを投稿