7月2日に発生し、現在も完全復旧には至っていないKDDIの大規模通信障害だが、多方面に影響を与えたことでも大きな注目を集めている。その原因は音声通話処理に関する部分で「輻輳」(ふくそう)が発生したためだというが、そもそも輻輳とはどのようなもので、なぜそれが通信障害を起こすほど甚大な影響を与えてしまうのだろうか。
大規模通信障害は「au」「UQ mobile」「povo」など、KDDIが提供するモバイル通信の利用者のほぼ全てに影響しただけでなく、KDDIのモバイル回線を利用している楽天モバイルやMVNO、さらにはKDDI回線を利用する多くの企業のサービスにも影響を与えることとなった。
実際この通信障害により、KDDI回線を利用していた銀行の店舗外ATMが使えなくなったり、宅配便サービスの配送情報が更新されなくなったり、気象観測点の一部データが収集できなくなったり……と、非常に多岐にわたるサービスで問題が発生した。それゆえ障害発生の翌日となる7月3日には金子恭之総務大臣が会見で「大変遺憾」と述べた他、KDDIも会見を開いて代表取締役社長の高橋誠氏らが謝罪。日曜日であったにもかかわらず、事態は非常に大きく動いた。
KDDIの説明会では、通信障害が発生した経緯について説明している。その時点では障害発生の最中であったことから正確な原因はまだ追及できていないというが、障害発生の契機となったのはコアネットワークのルーターを交換した際に、なぜか音声通話が一部不通となったことにあるようだ。
そこでKDDIでは急きょ、ルーターを元のものに戻して対処を図ったというが、その間に4Gのネットワークで音声通話をする「VoLTE」をつかさどる「VoLTE交換機」の部分でアクセス集中が発生。輻輳状態に陥り、それがネットワークの他の部分にも影響して大規模通信障害に至ったという。
実はこの「輻輳」というのは、一般にはなじみはないものの、通信業界では障害発生時に必ずと言っていいほど出てくる言葉でもある。一体輻輳とはどのようなもので、なぜネットワークに問題を起こすのかを改めて確認してみよう。
輻輳とはさまざまなものが1か所に集まってくることを示す言葉であり、通信業界においては音声通話やデータ通信のトラフィックが特定の箇所に集中する状態を指す。通信のネットワークは道路、そこを流れるデータは車に例えられることが多いのだが、輻輳は道路の特定の場所に車が集中し、渋滞が発生している状態と考えれば分かりやすいだろう。
それゆえ輻輳が起こす問題も、道路で起きる問題と共通している。渋滞で混雑すれば車の流れが悪くなり、走行する車の速度が落ちたり止まったりしてしまうが、通信でも同様に、輻輳が起きることで通信速度が遅くなったり、通信ができなくなったりする訳だ。
そしてネットワークのある部分で通信ができなくなってしまうと、他の部分にある機器からの要求にも応えられなくなるため、輻輳の連鎖が起きてしまうことも多い。今回のKDDIの障害でもVoLTE交換機で発生した輻輳が、スマートフォンなどの端末の位置を登録するモバイル通信の要となる「加入者データベース」からの応答に応えられなくなり、その結果加入者データベースにも輻輳が発生して障害の規模が大きくなってしまったのだ。
この輻輳はさまざまなタイミングで起きることがあり、代表的な事例は大規模災害の発生時である。災害発生時は多くの人が被災地に連絡を取ろうとするため、特定の地域に音声通話が集中して輻輳状態に陥り、電話がつながりにくい状態となってしまう。
以下略全文
https://news.yahoo.co.jp/articles/e444ed82d7d99d3fa139711c139f087bc904620d?page=2
みんなのコメント
コメント内容は「噂」として楽しんで下さい。確証が無いコメントもあります。
IT業界で輻輳が通じなくて驚いたことある
これが読めないのはまだ理解できる
事故が起きたときに私鉄では滅多にやらないJRだけ
いつも長時間客を閉じ込めるのはなぜ?
服装
面倒な事が起こったらステータスコードは大概これ
輳はこの熟語でしか見たことねえな
ADSLの障害の時とか5chでも頻出していた
あうのメイン通信ベンダーはサムチョンww
各キャリアが採用する5Gベンダーは基本4Gを踏襲も、中国系は採用見送り
https://k-tai.watch.impress.co.jp/docs/column/mca/1247403.html
docomoのリスク分散はさすがやな
まだ電話通じない!
混んでるってだけだ
きっかけに対して影響がでかすぎるのが気になる
こういうのってルーターいっこ失敗したくらいじゃ起きないように多重化してるもんじゃないの?
止まってたのが一気に始めるから
全てのノードで同時多発する 「拠点」トラブル
復旧中でもどんどんインプットされて滞留するんだから
生きている回線探して集中するわけか
AUの工事のタイミングで攻撃を仕掛けてきたのかな?
でるまで続けろ
povo2.0乞食が増えた直後というのも復旧が遅れた原因の一つでもあったりするんだろうか
> 輻輳は道路の特定の場所に車が集中し、渋滞が発生している状態と考えれば分かりやすいだろう。
いや分かりにくい。もっと具体的にどうなったかを説明してほしい。へんなたとえじゃなくて
俺の心臓なら脳からの指令が輻輳で混乱してたまに止まるぞ
これならわかる?
こいつらはまだ何かを隠してる
全く繋がらない端末はずっと今現在も繋がらず
土曜には復旧した端末は今も問題なく繋がる
なんで番号毎にそんな事になるんだ?
全ての端末が繋がったり繋がらなかったりするなら分かるんだけど
輻湊とか専門用語で誤魔化す
小池はこの逆で横文字で誤魔化す
わざと通信を絞ってるからなんですよ」みたいな報道ばっかりで唖然とする。
そんなに広告宣伝費が多いのかな?
輻輳というのは平たく言えば
山で「ヤッホー!」と叫んだのがエコーで「ヤッホー!」と返ってくる
それが無限に重なるうちに無音になってしまい
自分の声すらも聞こえなくなってしまった状態
なるほどそれが近いな
関連ワードとしてはボルダリングかな
>>177
分かりやすい例えだ
はなまるあげよう
説明ではルーター切り替え失敗で15分止まってた間の発信?が溜まって輻輳、っていう説明のように取れるんだけど、問題発生の時間帯、本当の通話発信がそれほどあったとは思えない。
スマホって常に自分の位置を常に知らせてるはずなんだけど、その情報が溜まりまくる&リトライ発生で輻輳起こしたってことではないのかな?
リトライで位置情報がどんどん送られてきてたら、時間帯によらずパンクしてしまうかも?ってのは、わからなくもない。
細かい仕組み知らないので頓珍漢なこと言ってるかもだけど。
でもこれ、仕組みかえればいいのでは?
通信の仕組みとして最初に加入者DBにアクセスしてステータスを書き、その後VoLTE交換機にアクセスしてそこで呼制御する。
今回、加入者DBとVoLTE交換機の間でステータス不一致だと通信出来ないルールになっていたので通信できなかった。
でも、「緊急モード」みたいなモードを作って、こういう輻輳の場合どっちかが神様データということで不一致であっても通信できるようにすればいいのでは?って思ってしまうんだが。
案外メーカーは「あ、それでもいいならそう実装しますが」ってあっさり実装してくれそうな気がするw
タダ電話モードになるから無理→データベース無視して通話
隣り合うLANのソケットを一本のLANケーブルで結べば
輻輳が体験できる
混雑でもいいけどさぁ
分かりやすい言葉で言うのがいいよ
もう既に輻輳が一番わかり易い
カバー範囲絞って帳尻合わせとる
電話がふくそうしていますなんて メッセージはとんと聞いたことないしな
いわゆる「電話回線がパンクする」ってやつ
昔チケットピアに電話したらそれで、地方からだと繋がりにくく、
当時聞いたところによれば、電話輻輳したらエリアで外部からの呼をシャットダウンするから
本気でチケット取りたいなら都内から掛けないといけないって聞いた
★ コメント 一覧 ★