オペレーションミス

転職して、アプリケーション構築だけでなく、サーバのソフトウェアインストールや設定などオペレーション作業も行わせていただけるようになりました。
貴重な経験を積むことができる機会を与えて頂き、ありがたく思っています。


しかし、本日オペレーションミスをしてしまいました。

覚悟はしていたか

すでにサービスを開始しているアプリケーションが動作しているサーバ上での作業でした。
したがって、作業中に何かミスをしてしまった場合、サービスに影響が起る事、最悪実害が発生する事も把握していました。
ですので、少なくとも作業開始前は今から行う作業への覚悟はありました。

ですが、結果的にミスを犯しました。
今振り返ると、作業を進める中で自分が実行しようとするコマンドがどのような結果になるのか、
どのサーバで作業を行なっているのか、といった事への注意が疎かになっていったと思っています。

自分には向いていないのではないか

自分は確認や注意する事への意識が足りない、長続きしない性格だと思います。
ですので、適性的にはあまりオペレーション作業には向いていないと思っています。

しかし、業務を投げ出すことはできません。
また、自分勝手な思いですが、オペレーション作業をもっと習得していきたいと思っています。
ですので、今回のミスを見直し、まとめることで今後同じミスを起こなさいための戒めとします。

今日の作業を振り返る

自分は、オペレーションの作業内容を予め作業手順としてまとめ、手順通りに作業を進めるようしていましたが、作業中に想定していないエラーが発生してしまいました。

ここで自分は、rootで作業中のコンソールをそのままに、エラー原因の調査を開始。
その結果、調査のために立ち上げた複数のコンソールの中に、作業対象サーバにrootで接続されたコンソールが存在する状態となってしまいました。

そして、ミスを犯します。
開発環境で実行・確認するつもりで、作業対象サーバにてコマンドを発行してしまいました。

何が問題だったのか

1. 作業から調査への移行

調査を始める段階でrootで作業していたコンソールを閉じていなかったことが問題。
作業対象のサーバを調査する必要があったとしても、rootのままでいる必要はなかった。

2. コマンドの実行サーバの確認不足

現在自分がどのサーバで作業をやっており、どのようなコマンドを実行しようとしているのか確認することが疎かになっていた。

3. そもそもの知識不足、確認手段の安易な選択

「2」でのコマンドは本当に実行し確認する必要はあったのか。
(調べれば|聞けば)分かることではなかったのか。

今後の対策

「1. 作業から調査への移行」への対策

作業を中断する必要な状態になった場合は、作業中のコンソールは落としてしまう。

「2. コマンドの実行サーバの確認不足」 への対策

現在作業しているサーバがどのサーバなのか分かりやすい環境を構築することにする。

「3. そもそもの知識不足、確認手段の安易な選択」 への対策

勉強する。自分の知識不足をもっと認め、自尊心を捨て周りに聞く。

だが、しかし

現状、すべてが後手に回ってしまっています。
ミスを起こしてしまってから、反省、改善を行なってもミスが起きた事実は変わらないので、
自分の性格をもっと自覚し、ミスが起こりにくい環境の構築をもっと積極的に行うべきだと考えています。
また、オペレーションに関する知識をこれまで以上にもっと深めていくことも必須だと考えています。

明日から

今日は落ち込みました。
この気持が風化してしまう前に、こうやってエントリーとして残しておきたいと考えちょっと頑張ってみました。
明日からは改めて業務を行いたいと思います。
そして、今後、オペレーション作業を行う際は、この記事を見なおし気を引き締め取り組むつもりです。