忍者ブログ

tplink製のスイッチングhubでvlanに切り替えたらストームが発生した話

2024年11月24日
前に、TL-SG108E を使ってVLANの設定をやった話を書いた。

http://aki.p-kin.net/etc/tplink製のスイッチングhubでvlanの設定をした話

動作確認を終えて、グループ毎に順次切り替えをやったらストームが発生して切り戻しをすることになった。今回はその話。




前の記事のとおり、なかなか便利なHUBがお手頃価格で入手できるので思わず飛びついて設定をしたんだけど、性能面の考慮がほとんどできてなかった。

正直、やってみないことにはわからないよね。。。

構成

まずは構成についておさらい。



作業前の構成(左側)は、ルーター配下にスイッチングHUBがあってその下にパソコンがあるシンプルな構成。大元のルーターがDHCPサーバーをやってる。
1つ例外があって、パソコンに紛れてルーターが1台設置されてて、ルーター配下は固定IPのパソコンが10台くらいぶら下がってる。

VLANの構成(右側)は、インターネットに接続するネットワークを6つのグループに分割。各テーブルに置くHUBの1-4ポートに4グループ(グループA - D)を割り当てて、残り2グループ(グループE , F)は大元のHUBのポートに割り当て。
図のvHUBはVLANを設定したHUBのこと。

8ポートHUBだけど、トランク用に2ポート、内部通信用に2ポート使うので空きなし。
6グループの通信はトランクポートを使ってHUB間で共有。

VLAN HUB の配下には各グループのHUBを接続。

切り替え作業でストーム発生

切り替え作業は、切り戻しを考慮して1グループずつ実施。大元の接続も⭐︎の位置に繋いで、最後に繋ぎ変える作戦。

まずは大元vHUBに接続する2グループをVLAN配下に切り替え。
HUBしかないグループAは問題なかったけど、ルーターが接続されたグループBを切り替えたらネットに出れず。

HUBの管理画面への接続も調子悪い!?

HUBのトランクポートを見るとめっちゃ高速に点滅してる。

軽く原因調査

Wiresharkでログを取りながらリトライ。やっぱダメ。
他のグループもログを取りながら切り替え。こっちは成功。

10秒間のキャプチャを比較すると、ルーターがいるグループの切り替え時は3万パケットくらい飛び交ってストーム状態になってた。他を切り替え時は3000パケット未満。こりゃダメだ。

推定原因

接続変更によってMACテーブルがリセットされて、ブロードキャストパケットがトランクポート内を行き来したのが原因と推定。

VLANでグループ間の通信を遮断してるから、トランクポートには全ての情報転送が必要になって負荷がかかるってことが勉強になった。
VLANの構築って机上では設定できても、性能面とか考慮しなきゃいけないのね。

対策

しばらく放置すれば収束するのかもしれないけど、HUBのポートが壊れても嫌なので設定を変更。

大元のVLAN HUBにしかポートがないグループは、トランクポートへ転送しないようにした。
設定変更後に切り替え作業を行って、無事に通信できるようになった。
ほんとは原因の調査をしたかったけど、復旧優先だから仕方ない。

この障害以降、ピカピカ光るトランクポートのランプを見るたびにHUBが限界なんじゃないかと不安に思うようになった。

まとめ

今回は、VLANの導入時にストームが発生した話を紹介した。ルーターをVLAN配下に移動させる場合には注意が必要。

机上ではできても、VLAN独特のトランクポートの負荷を考慮しなきゃいけないよってのが教訓です。

現在は、グループEのルーター配下のパソコンは、全てグループBに移動して問題なく運用できてるので、やっぱルーターがダメって話でした。



PR
Comment
  Vodafone絵文字 i-mode絵文字 Ezweb絵文字