Page 2 of 3

Re: timer:timerfd_settime: Bad file descriptor

Posted: 19 Mar 2018, 10:43
by brodayga
dimka88 wrote: 15 Mar 2018, 07:31 ps:/ Вы RAM мониторете? Случайно не зафиксировали утечку памяти?
Да. Утечки нет.

Re: timer:timerfd_settime: Bad file descriptor

Posted: 17 May 2018, 11:26
by brodayga
Добрый день опять вылезла ошибка с таймером . Аксел просто завершил работу без падения. Аптайм был больше месяца.

Code: Select all

[2018-05-17 13:16:01.744]timer:timerfd_settime: Invalid argument
Используется:
ipoe
shared=1
mode=L2
start=dhcpv4

radius

accel-cmd --version
accel-cmd 89056070effd890afcefaefcd3ee257dc1a447ee

SMP Debian 4.9.65-3+deb9u1 (2017-12-23) x86_64 GNU/Linux

Re: timer:timerfd_settime: Bad file descriptor

Posted: 17 May 2018, 19:40
by dimka88
Логи уровня 5 остались минуты 2 перед завершением?

Re: timer:timerfd_settime: Bad file descriptor

Posted: 18 May 2018, 06:45
by brodayga

Re: timer:timerfd_settime: Bad file descriptor

Posted: 21 May 2018, 14:31
by dimka88
В логе заметил много записей

Code: Select all

debug: libnetlink: RTNETLINK answers: Cannot assign requested address
покажите еще lua файл и полную секцию [ipoe]

Re: timer:timerfd_settime: Bad file descriptor

Posted: 22 May 2018, 05:50
by brodayga

Code: Select all

[ipoe]
verbose=10
lua-file=/etc/accel-ppp.lua
username=lua:username
password=test123
l4-redirect-on-reject=600
l4-redirect-ip-pool=unauth
lease-time=180
max-lease-time=3600
unit-cache=20
offer-delay=0,10:700,20:1000,30:1100,40:1200,150:1300,160:1400,170:1500,180:1600,190:1700
shared=1
mode=L2
start=dhcpv4
ip-pool=ipoe
gw-ip-address=172.16.64.1/20
gw-ip-address=172.17.64.1/22
gw-ip-address=172.17.68.1/22
interface=re:^eth0\.1...\..*$|^eth0\.2...\..*$
vlan-mon=re:eth0\.1...,2-254
vlan-mon=re:eth0\.2...,2-254

Re: timer:timerfd_settime: Bad file descriptor

Posted: 22 May 2018, 06:02
by brodayga
dimka88 wrote: 21 May 2018, 14:31 В логе заметил много записей

Code: Select all

debug: libnetlink: RTNETLINK answers: Cannot assign requested address
Эта запись постоянно вылетает . Появляется после того как каой-нибудь интерфейс был 'terminated'. Как я понимаю аксел пытается провести манипуляции с адресом на несуществующем интерфейсе??!
На старых сборках и старом ядре 3.2 не замечал.

Хочу уточнить сервер работает под нагрузкой. Т.е. это не 500 абонентов. А около 3000. И работал что первый раз до остановки 1,5 месяца, второй раз 36 дней.

Re: timer:timerfd_settime: Bad file descriptor

Posted: 22 May 2018, 06:08
by brodayga
Обе остановки не в час пик.

Re: timer:timerfd_settime: Bad file descriptor

Posted: 22 May 2018, 13:17
by dimka88
Рекомендации:
1. Попробуйте закомментировать #unit-cahce и проверить лог на присутствие дублирующих ip (то есть ip уже выдан какому то интерфейсу и потом прилетает такой же), если оправдается, пробуйте устранить ситуации на стороне radius
2. Проверьте вывод accel-cmd show stat конкретнее секцию radius на присутствие loss.

Ситуацию выловить не просто, планирую пока попробовать воспроизвести на стенде и возможно в дальнейшем скооперироваться с Дмитрием для внесения дополнительного логирования отработки функции timerfd_settime

Re: timer:timerfd_settime: Bad file descriptor

Posted: 22 May 2018, 16:43
by brodayga
dimka88 wrote: 22 May 2018, 13:17 Рекомендации:
1. Попробуйте закомментировать #unit-cahce и проверить лог на присутствие дублирующих ip (то есть ip уже выдан какому то интерфейсу и потом прилетает такой же), если оправдается, пробуйте устранить ситуации на стороне radius
С юнит кеш проверю. А вот дублирующих не может быть. Серые раздаёт сам аксел. Радиус только белые дублей нет.