Может немного и не туда.
Вот не сколько месяцев не могу уловит проблему. Пару раз в день пропадает трафик на нескольком минут, в разное время. Просто все замирает и ходят только арп запросы.
Использую accel-ipoe с freeradius rlm_python. Проблема только там где стоит OLT BDCOM (PON).
На агрегации стоит Dlink DGS-3120. Он пакует QinQ вланы.
Тоесть например. Если в длинк включен узел с OLT или просто напрямую OLT, то проблема появляется на всех устройствах которые подключены к данному S-vlan на порту. Там где нет OLTов, проблем тоже нет. Уже от фонаря пробовал на свичах включать/отключать dhcp-snooping, arp-inspection ip verify source, фильтры dhcp и т.д. Никакой реакции.
Может олты посылают какие-то кривые пакеты?
Схемку с проведением теста для наглядности прилепил. Для теста назначил статический IP(10.0.0.2) на ноуте и БРАСе (bond0.264.1256, 10.0.0.1).
Так же, на втором сервере создал такой же интерфейс(eth0.264.1256, 10.0.0.3). Через БРАС траф пропал, со 2 сервером все работало. От чего может пропадать траф? Проц, память, conntrack таблица в норме.
BRAS - Debian 8
тюнинг https://pastebin.com/afrhkNUQ (rp_filter уже отключен, ядерный proxy_arp тоже отключен)
accel - https://pastebin.com/JKadUuCN
freeradius - https://pastebin.com/TaGAVkgy
accel-ppp version 904bc0f9eefffff153282277ea21729f46c1489d
FreeRadius 3.0.11 (git #1bb37e8)
Из логов радиуса есть только одна ругань:
Code: Select all
Wed May 17 14:26:03 2017 : Error: Received conflicting packet from client 127.0.0.1 port 60187 - ID: 21 due to unfinished request. Giving up on old request.
Wed May 17 14:26:03 2017 : WARNING: (2557959) WARNING: Module rlm_python became unblocked for request 2557959
На брасе ~3000 accel сессий в пике. Количество сессий никак не влияет на падения.
Дамп при пропадании трафа с обеих сторон (БРАС и ноут) - http://khobta.com/dump.zip (С 20:05 упало. Но часовая метка в дампе 17:05 почему-то.)
Куда еще можно копнуть для выявления проблемы? Предоставлю любую инфу, нужен свежий взгляд)
Спасибо