Зависания ...
Posted: 25 Nov 2016, 12:48
Привет всем!
Преамбула.
Есть у меня несколько pptp серверов: Два на фряхе с pppd на борту и три на debian 8 с accel-ppp соответственно. Недавно добавился ещё один для IPoE/PPPoE/PPTP так же на debian с accel.
Так вот что меня мучает уже пол года: Почему-то, сервера с accel периодически наглухо зависают. То есть сервер может зависнуть раз в день, а может раз в неделю. Вообще. Наглухо. Ни на консоль, ни на клавиатуру, вообще ни на какое прерывание он не отвечает при этом. Ошибок в системных логах нет никаких, то есть всё у него хорошо и замечательно и вдруг БАХ! и повис...
Я пробовал использовать centos, пробовал пересобирать и обновлять до экспериментально ядро. Пробовал менять железо, сетевые карты разных вендоров - ничего не помогает. Я мониторю "здоровье" своих серверов и могу сказать, что до момента зависания, как говорится, - ничего не предвещает беды, ни CPU, ни ОЗУ, ни HDD не "протекают". Стоит оговориться, что нагрузка на этих серверах ~50 PPTP сессий в пике с шейпами в 50Mbit/s - смехотворно. Складывается ощущение, что прилетает какой-то зафоршмаченый пакет который вводит в ступор accel и весь сервер вместе с ним.
Даже не приложу ума как это дебажить. Запускать с gdb и оставлять это дело на неизвестно сколько времени? Бывают случаи что они месяцами работают без нареканий. Может кто подскажет какую дельную идею...
UPD
С серверами на который PPPoE такого не происходит. Только с серверами, на которых PPTP.
Преамбула.
Есть у меня несколько pptp серверов: Два на фряхе с pppd на борту и три на debian 8 с accel-ppp соответственно. Недавно добавился ещё один для IPoE/PPPoE/PPTP так же на debian с accel.
Так вот что меня мучает уже пол года: Почему-то, сервера с accel периодически наглухо зависают. То есть сервер может зависнуть раз в день, а может раз в неделю. Вообще. Наглухо. Ни на консоль, ни на клавиатуру, вообще ни на какое прерывание он не отвечает при этом. Ошибок в системных логах нет никаких, то есть всё у него хорошо и замечательно и вдруг БАХ! и повис...
Я пробовал использовать centos, пробовал пересобирать и обновлять до экспериментально ядро. Пробовал менять железо, сетевые карты разных вендоров - ничего не помогает. Я мониторю "здоровье" своих серверов и могу сказать, что до момента зависания, как говорится, - ничего не предвещает беды, ни CPU, ни ОЗУ, ни HDD не "протекают". Стоит оговориться, что нагрузка на этих серверах ~50 PPTP сессий в пике с шейпами в 50Mbit/s - смехотворно. Складывается ощущение, что прилетает какой-то зафоршмаченый пакет который вводит в ступор accel и весь сервер вместе с ним.
Даже не приложу ума как это дебажить. Запускать с gdb и оставлять это дело на неизвестно сколько времени? Бывают случаи что они месяцами работают без нареканий. Может кто подскажет какую дельную идею...
UPD
С серверами на который PPPoE такого не происходит. Только с серверами, на которых PPTP.