QinQ Vlan int state DOWN (странное)

IPoE related questions
Post Reply
AccelGood
Posts: 25
Joined: 29 Jan 2019, 08:05

QinQ Vlan int state DOWN (странное)

Post by AccelGood »

День добрый.
Есть два сервера с QinQ vlan per user
Одинаковая сборка git accel, но разные ядра
На первом всё хорошо, а на втором бывает странное.

Иногда после окончания сессии:
[2020-02-18 10:50:45]: info: eth1.3221.147: pppd_compat: ip-down started (pid 3515)
[2020-02-18 10:50:45]: info: eth1.3221.147: pppd_compat: ip-down finished (1)
[2020-02-18 10:50:45]: info: eth1.3221.147: ipoe: session finished

Интерфейс переходит в состояние DOWN и висит в нём:
/sbin/ip link show eth1.3221.147
118624: eth1.3221.147@eth1.3221: <BROADCAST,MULTICAST> mtu 1500 qdisc noqueue state DOWN
link/ether 90:e2:ba:35:8d:78 brd ff:ff:ff:ff:ff:ff

Через время (vlan-timeout) интерфейс падает:
[2020-02-18 10:55:45]: info: ipoe: stop interface eth1.3221.147
[2020-02-18 10:55:45]: info: ipoe: remove vlan eth1.3221.147

Но не всегда. Поэтому приходится отслеживать интерфейсы в DOWN висящие более 5 мин и прибивать их через vconfig rem

На первом сервере такого нет. На нём интерфейсы всегда UP и исчезают после vlan-timeout
На серверах были разные ядра, вчера обновил второй, ядра стали одинаковые. Accel собрал 1.12 Но проблема не ушла...
Подозреваю что из-за этого второй сервер иногда падает...
dimka88
Posts: 866
Joined: 13 Oct 2014, 05:51
Contact:

Re: QinQ Vlan int state DOWN (странное)

Post by dimka88 »

Добрый день, если сервер падает, все же лучше собрать с DEBUG https://accel-ppp.org/wiki/doku.php?id= ... 0%B5%D1%82
Еще стоит обратить внимание в journalctl на предмет вмешательства systemd и udev
ps:// Не стоит удалять интерфейсы которые могут быть не освобождены accel-ppp, вероятность что упадет будет высока.
AccelGood
Posts: 25
Joined: 29 Jan 2019, 08:05

Re: QinQ Vlan int state DOWN (странное)

Post by AccelGood »

Падает не каждый месяц даже. В логах ничего от udev страшного не вижу. Если не удалять интерфейсы то они так и висят в down и возникают проблемы с подключением пользователя.
Здесь на accel пока вообще нет оснований думать. Не понимаю почему так по разному происходит удаление интерфейса и куда копать(
dimka88
Posts: 866
Joined: 13 Oct 2014, 05:51
Contact:

Re: QinQ Vlan int state DOWN (странное)

Post by dimka88 »

Нужно включить debug и verbose=1 в секциях. unit-cache используется?
AccelGood
Posts: 25
Joined: 29 Jan 2019, 08:05

Re: QinQ Vlan int state DOWN (странное)

Post by AccelGood »

Хорошо, попробую как представится возможность. unit-cache не используется
AccelGood
Posts: 25
Joined: 29 Jan 2019, 08:05

Re: QinQ Vlan int state DOWN (странное)

Post by AccelGood »

Разобрался.
В конфиге затесался proto=100, убрал, всё стало хорошо.
Но ;)
На свежем сервере стоит 1.12.0
И там несколько раз в день в радиусе проскакивает "Error: Discarding conflicting packet from client" при stop-сесии и радиус сессию не заканчивает.
Проследил одну из сессий.
Accel:
Спойлер
2020-03-03 22:30:51]: info: eth1.3267.117: send [RADIUS(1) Accounting-Request id=2 <User-Name "eth1.3267.117"> <NAS-Identifier "bras_ipoe1"> <NAS-IP-Address X.Y.Z.14> <NAS-Port 392174> <NAS-Port-Id "eth1.3267.117"> <NAS-Port-Type Ethernet> <Calling-Station-Id "00:04:61:a9:98:2e"> <Called-Station-Id "eth1.3267.117"> <Acct-Status-Type Stop> <Acct-Authentic RADIUS> <Acct-Session-Id "447f89341b01a0a8"> <Acct-Session-Time 600> <Acct-Input-Octets 778> <Acct-Output-Octets 8076> <Acct-Input-Packets 5> <Acct-Output-Packets 165> <Acct-Input-Gigawords 0> <Acct-Output-Gigawords 0> <Framed-IP-Address X.Y.Z.83> <Acct-Terminate-Cause Lost-Carrier>]
Radius:
Спойлер
Tue Mar 3 22:30:51 2020
User-Name = "eth1.3267.117"
NAS-Identifier = "bras_ipoe1"
NAS-IP-Address = X.Y.Z.14
NAS-Port = 392174
NAS-Port-Id = "eth1.3267.117"
NAS-Port-Type = Ethernet
Calling-Station-Id = "00:04:61:a9:98:2e"
Called-Station-Id = "eth1.3267.117"
Acct-Status-Type = Interim-Update
Acct-Authentic = RADIUS
Acct-Session-Id = "447f89341b01a0a8"
Acct-Session-Time = 600
Acct-Input-Octets = 778Interim-Update
Acct-Output-Octets = 8076
Acct-Input-Packets = 5
Acct-Output-Packets = 165
Acct-Input-Gigawords = 0
Acct-Output-Gigawords = 0
Framed-IP-Address = X.Y.Z.83
Acct-Unique-Session-Id = "c1195004730b7df2"
Timestamp = 1583260251
Request-Authenticator = Verified
Вопрос: почему Acct-Status-Type из Stop превратилась в Interim-Update?

И еще в Radius сессии теряются только с id=2
Спойлер
Sun Mar 1 13:37:25 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 43814 - ID: 2 due to recent request 216087.
Sun Mar 1 16:37:42 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 51927 - ID: 2 due to recent request 294908.
Sun Mar 1 20:43:49 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 40589 - ID: 2 due to recent request 406217.
Mon Mar 2 15:28:58 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 45198 - ID: 2 due to recent request 271304.
Tue Mar 3 02:19:13 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 50169 - ID: 2 due to recent request 569161.
Tue Mar 3 10:07:20 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 57557 - ID: 2 due to recent request 133416.
Tue Mar 3 10:39:09 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 47474 - ID: 2 due to recent request 146825.
Tue Mar 3 12:59:08 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 51621 - ID: 2 due to recent request 10915.
Tue Mar 3 15:38:30 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 58990 - ID: 2 due to recent request 81376.
Tue Mar 3 18:20:01 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 57411 - ID: 2 due to recent request 154774.
Tue Mar 3 20:57:38 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 59041 - ID: 2 due to recent request 230364.
Tue Mar 3 22:30:51 2020 : Error: Discarding conflicting packet from client bras_ipoe1 port 56545 - ID: 2 due to recent request 274759.
На втором сервере стоит старее сборка "accel-cmd 7a08d2a9fd1dc942d5ac09d069eea258b1e0c7d8", там такой проблемы нет.
dimka88
Posts: 866
Joined: 13 Oct 2014, 05:51
Contact:

Re: QinQ Vlan int state DOWN (странное)

Post by dimka88 »

@AccelGood, было исправление в мастер ветке, не успело этой войти в 1.12.0 https://github.com/xebd/accel-ppp/commi ... ed292418a3
Может прилететь одинаковый ID для interim-update и acct-stop
AccelGood
Posts: 25
Joined: 29 Jan 2019, 08:05

Re: QinQ Vlan int state DOWN (странное)

Post by AccelGood »

dimka88 wrote: 05 Mar 2020, 08:27 @AccelGood, было исправление в мастер ветке, не успело этой войти в 1.12.0 https://github.com/xebd/accel-ppp/commi ... ed292418a3
Может прилететь одинаковый ID для interim-update и acct-stop
Спасибо!
Post Reply