« ついに全線走破 | Main | ムシャクシャして・・・? »

相次ぐトラブル

人の問題あり、モノの問題あり、と言って良いのか。

東京証券取引所(東証)と、名古屋証券取引所(名証)が、相次いでトラブルを起こし、共に半日株取引ができない事態に見舞われた。東証の場合は「プログラムミス」、名証は「ファイル破壊」ということだが、いずれにせよ日本の根幹を担う「社会システム」の障害で、いずれのシステムも提供しているベンダーの富士通にとっては、相次ぐトラブルで風当たりは非常に強くなっているだろう。私は過去に富士通関係の会社に在籍し、東証にも(まったく別のシステムの関係で)訪れたことはあるのだが、何か他人事とは思えないトラブルである。

東証の件はプログラムのテストでは見つけられなかったと言い、月替わりで判明したという、厄介なものだった。二重化が効くハードウェアであれば、一方にトラプルが発生しても「待機系」で運用を続けられるが、ソフトウェアでのトラブルは、ミスを起こすと元に戻すのにも時間がかかり、重大なトラブルの場合は致命的である。こういう社会システムほどテストは念入りに十分に行われるはずだ。東証のような大きな体制で何人も掛かっても見つけられなかったのか、それともチェックが十分でなかったのかは当事者でないので分からないが、トラブルが起こると、プログラムは簡単に修正できるものでは無いし、間違って更新したデータをいつの時点に戻すのか等、いろんな検討要素が発生し、時間がかかるのは必至だ。

名証の場合は「データベースファイルの破壊」という、これまた厄介な原因だ。データベースは大規模になる程、破壊された場合のリカバリに時間がかかる。バックアップからファイルを戻して、アーカイブログを反映させて、あるいはシステム立ち上げからのトランザクションをもう一度発生させる等、データベースの「内容」を最新の状態に戻すのには、時間がかかるものである。リカバリより先に障害原因の切り分けにも時間を要しているはずで、その時間も含めるとクラスタ(にしていると仮定して、それ)が上手く動かなければ、数時間のシステム停止は常識的なところだろう。

しかし、そんな「システム停止」は、社会システムでは許されない。システムも巨大化すればするほど関わる人も多くなり、調整事項も多くなる。参加する会社は、下請けを含めると数社から十数社になり、サブシステムも増え、プロジェクトマネージャとチームリーダー等との打ち合わせは増え、それをメンバの末端まで意識を統一するのはなかなか大変だ。人が多くなるとミスも多くなる。そんなミスを防止し、起こったミスを修復する現場のリーダーやマネージャー個人に対する負荷は増大し、ストレスは溜まり、病気になる人もいる。私が過去に在籍したプロジェクトでは、死者が出ることもあった(東証では無いが)。

いずれにせよ、ベンダーの立場からすれば「仕方がない」ことも幾分かはあるとは思うが、顧客にとっては「絶対に止めてはいけないシステム」だ。特に証券取引所の停止は国にとっても大きな損害であり、停止した際の批判も民間のシステムに比べると多大なるものだろう。社会システムの停止はすかさず新聞ニュースのネタになり、テレビでも多々放送される。テレビのキャスターの素人コメントにはややガクっと来るが、最近はITに対するリテラシーも浸透してきたのか、一般人にも「システム障害」の意味がわかるようになって来ている。

ベンダーとしては、システムの停止が一般人に対するイメージにまで影響してくる昨今では、下手にミスは起こせない。もちろん日々トラブルを起こさないために努力する現場の状況は、同業者として大体、痛いほどわかる。しかしそんな中でもシステムが停止すれば即批判の嵐なので、特に社会システムに携わる人には、歯を食いしばって頑張ってほしいと思う今日この頃である。

・・・私も、最近はそういう緊張するシステムには、テンでごぶさたであるが(^^;

人気blogランキングへ

|

TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/27348/6936447

Listed below are links to weblogs that reference 相次ぐトラブル:

Comments

Post a comment