◇
このシステム障害は、部品の発注処理を行う複数のサーバの一部が利用不可になり発生した。27日に行った定期保守作業の際、データベースにたまったデータの削除と整理をしたが、作業用ディスクの容量が不足していたため、エラーが起きてシステムが停止したという。
◇
保守作業用の作業ディスクが足らなかったとのこと。
通常運用のデータで通常より削除対象が多く発生したかもしれない。
リソースの監視をしていないはずはないが、保守作業用の一時的なリソースの監視は盲点だったかもしれない。
定例作業のようだしこれまで問題なく作業していたとあれば油断があったのかも。
◇
◇
Amazon
0 件のコメント:
コメントを投稿