調査の優先度と事象の切り分け方 | 無線LANトラブル対応実記(3)

調査の優先度と事象の切り分け方 | 無線LANトラブル対応実記(3)

前回までのおさらい

無線APの更新を行ったところ、更新直後にネットワークに繋がらない、ネットワークが遅くなったパソコンが発生しました。
原因を切り分け、パソコン側の暗号化規格の設定誤りにより新無線APがサポートしていないWPAパーソナルが設定されていたことが判明しました。

この原因に該当するパソコンの設定を全台修正しましたが、それでもまだ不具合が起きているパソコンが残っています。
新無線APは新たに5GHz帯の高速伝送規格であるIEEE802.11acに対応しましたが、それに関連した原因の調査にあたって無線LANの伝送規格についてまとめてみました。

スポンサーリンク

調査の優先順位付けについて

繋がらない>繋がるけど遅い、何人も起きている>1人しか起きていない

初回に説明したWPAパーソナルの設定は、ベンダーに問い合わせた瞬間に瞬殺で回答が出たので一早く対応できましたが、これに該当していなけどネットワークに繋がらないパソコンがまだ残っています。

1台ずつ見ていく必要はありますが、当然順番にやっていけばいいものではありません。
「繋がらない」と「遅い」では、当然「繋がらない」の対応が急がれます。
遅くても繋がるのであれば業務継続は不可能ではありません。
「繋がらない」は業務継続が不可能な状態です。

ただ「繋がらない」人が1人だけで、「遅い」人が多数いる場合、優先度は検討する必要があります。「繋がらない」1人に代替パソコンを渡してネットワークに繋がれば業務継続が可能になるかもしれません。
パソコンローカルに保存されたファイルは使えませんが、応急処置ができれば調査は後に回すことができます。暫定対応でも運用が確保できれば、時間をかせぐことができるのです。

優先されるのは運用継続、恒久対応への道筋も忘れずに

暫定対応がいつの間にか恒久対応になる、ということも往々にしてあります。
決して褒められるものではないかもしれませんが、「運用上支障が無ければ触らない」と割り切ることも場合によっては必要です。

ただしそこで起こっている現象や、この対応をしなかったらどうなるか等はキチンと記録し、情報を公開しておかなくてはいけません。
自身の忘備録でもありますし、不在時や引継ぎの際に他の人に情報を正確に展開するためにも必要です。

きちんと記録に残して、それが他の人からもアクセスできるようにしておくよう心がけましょう。

問合せパターンから、潜在的な問題が無いか検討する

問題が発生した時はリアルタイムで次々に情報が入ってきます。
簡易的でいいので問合せに紐づく情報を採取して、一覧化しておきましょう。
そこから傾向が見えてくる場合があります。

<傾向の例:無線LANの場合>
・特定の部署やセグメントで問題が集中している。
・Windows10の端末だけで問題が発生しており、他のOSでは起こっていない。
・同時期に導入した同じメーカーの同機種のパソコンだけ発生している。
・特定のソフトがインストールされたパソコンだけ発生している。

部署やセグメントというのは物理的な場所になります。
その端末のOS、導入時期や型番、インストールされているフォルト等、判断に必要な情報が正しく管理されていれば、調査のスピードは速くなります。
この辺りは以前紹介したIT資産管理ツールによる管理が効果を発揮します。

ネットワーク情報や機器情報、ソフトの情報等を自動で取得・管理できる以外に、リース開始日やリース期限を管理できる機能がある製品も多々あります。

遅延は特定の部署だけで発生

今回「繋がらない」という人は2~3人だったので、そちらは一時的に有線LANに切り替えてもらいました。一方で遅延が発生していたのは部署丸ごとで人数も多いため、こちらの対応を優先することにしました。

この部署はOA用のパソコンは全てノートパソコンで、無線LAN子機を内蔵はしていますが今回からサポートされる5GHz帯の11acに対応したパソコンはあまり導入されていませんでした。
更新前と同じ2.4GHz帯の11nで通信しているパソコンが大半で、現象が起きているのも11nで接続しているパソコンのみ、ということがわかりました。

ただし同様のパソコンは社内の他部署にも存在しており、パソコン固有の問題ではなく、あくまで部署のロケーションでのみ発生する問題であると切り分けました。

「繋がらない」より厄介な「遅い」

ネットワークに繋がらない不具合は業務継続においては重大な影響がありますが、繋がるようになれば改善されるのですから改善の結果は目に見えてわかります。

「遅い」は難物です。一応データ転送速度という数値指標はありますが、大半は利用者の体感的な速度が早くならないと改善したと認識してくれません。

サーバからのファイルコピーやWeb閲覧が遅いと「ネットワークが遅い」と言われることが多いですが、それらの速度には実際にはサーバ側の負荷状況、パソコン側の負荷状況も加味されなければいけません。

メモリ搭載量が小さくCPUも貧弱で常駐プログラムが常にディスクI/Oをしているようなパソコンで同じ事が起これば、ある程度の人は「ネットワークではなくパソコンが重い」と判断することができるのですが、そんなわかりやすい状況ばかりではありません。

今回の場合、体感的な速度遅延ではありますが、無線APの更新前後で明らかな差があり、且つ部署内で広範囲に発生しているため、原因は無線APにあると考えるのが妥当です。

スポンサーリンク

急がば回れ、思い込みは禁物

ヒントになりそうな情報はとりあえず拾っておく、ではなく

問題の切り分けや分析を省略して、とにかく目の前のパソコンで起きている障害対応に向かうのは、結果的に対応時間を長くしてしまうことがあります。

発生している事象をカテゴライズすることで、同じ条件なのに現象が起きていないパソコンも発見できます。
もしかしたら現象が発生していないのではなく、問い合わせが来ていないだけで同じ現象が発生しているかもしれません。まずは障害の影響がどこまで広がっているのかを正しく把握することに努めましょう。

また聞き取りをする内容は対象のものによって準備しておいたほうが良いでしょう。
不具合が発生してしまえば、程度にもよりますが情報整理より個別の不具合対応に手をとられがちです。
あらかじめ確認しておく事項を準備しておくことで、スムーズで漏れのない聞き取りを行うことができます。

ネットワークに限りませんが、最後のアウトプットをイメージした上で、そこに辿り着くためには何の情報が必要かを考えて聞き取り項目を精査しましょう。

ここまで調査の優先度や事象の切り分けの話をしてきましたが、次回はいよいよ実調査の事例をお話したいと思います。

ネットワーク・インフラカテゴリの最新記事