NTTドコモは、2021年10月14日に発生した全国規模のネットワーク障害について、原因や経緯の説明を行った。
最初に、今回発生したネットワーク障害の概要を解説しよう。NTTドコモでは10月14日から午前0時から、IoTサービスにおける加入者位置情報サーバー(ネットワークの世代によって呼び方や細かな機能が異なるが、本記事中は便宜的に、HSSとして統一して記述する)を旧設備から新設備に移す作業を開始したところ、予期せぬ不具合が発生、午前7時26分に旧設備に戻す作業を開始した。その作業が終了した16時36分にIoT機器に対して位置情報の登録をうながす通常は行わない措置を実施したところ、トラフィックの増加に耐えきれず17時頃にHSSに輻輳(ネットワークの混雑・渋滞)が発生した。
この状況を受けて、17時37分から19時57分までの期間、位置情報の更新に対して最大100%のネットワークコントロールを実施した。NTTドコモのネットワーク設備は仕様上、今回問題を起こしたIoT向けのHSSとスマートフォンや携帯電話などそれ以外の用途で使われるHSSを分けてコントロールができない。そのため、やむを得ず3G、4G、5Gのネットワークすべてを一律でコントロールすることになり、ユーザーへの大きな影響が現われた。
ネットワークコントロールが解除された後も、ユーザーが殺到したことで輻輳は続き、4Gと5Gが復旧したのは翌日15日午前5時5分となった。3Gネットワークについては15日16時の時点でも、回復しているものの完全に復旧はしてない。
HSSは、数年前に一部のMVNOが独自サービスを開始するに当たって必要になるため一時期話題になったものだ。モバイルネットワークでは、HSSで端末がどこにいるかを随時把握することで通信が可能となる。しかし、HSSが機能せず位置情報が更新されない場合、端末側ではアンテナピクトが表示されなかったり、表示されても4Gや5Gといった表示が消えて、データ通信や音声通話が行えなくなる。
なお、今回の障害期間中でも、どこにも移動させず位置情報が更新されなかった端末ならデータ通信は利用できた。ただし、音声通話については、信号交換機や音声交換機と言った設備も二次的な輻輳が発生したため利用しにくい状況となっていた。
今回の障害は、地理で見ると全国規模のもので、HSSコントロールに限っても影響のあったユーザーは約200万ユーザーにのぼる。なお、通信や音声通話が行えなかったユーザーの数は現在調査中とのことだが、障害のあった期間中に、音声通話は全国で15%、データ通信は約4%それぞれ減少していたという。
今回のネットワーク障害を時系列でまとめたもの。ユーザーに対する影響は4Gと5Gについては14日17時頃から翌日5時5分までの約12時間という期間にわたった
HSSは、位置情報が更新されるたびに書き換えられる。位置情報がない場合、データ通信や音声通話が行えなくなる
今回の障害では音声通話を管理する信号交換機と音声交換機も二次被害を受け、利用しにくい状態となった。なお、端末を移動しなかった場合、位置情報が更新されないのでデータ通信はそのまま利用できた
今回の障害は、3G、4G、5Gすべてのネットワークが影響を受けたこと、全国に影響が及んだ点で影響がことのほか大きかった。レンタルサイクルや電子決済にも影響があったという声もSNSでは流れていた。
なお、今回の事象のきっかけとなったIoT向けHSSの交換の予期せぬ不具合の再発防止策を今月中にまとめるとしている。ただし、かなり大規模な作業となるため、改めて計画を立て直したうえで実施されるという。
ユーザー視点で見ても、モバイルネットワークが使えないことの不便さを改めて実感した人は少なくないだろう。
再発防止策は10月下旬にまとめる予定。ただし、発端となるIoT向けHSSの交換は、改めて計画を立てて実行することになり、当面の予定は白紙となる
FBの友人は4人のヒキコモリ系デジモノライター。バーチャルの特技は誤変換を多用したクソレス、リアルの特技は終電の乗り遅れでタイミングと頻度の両面で達人級。