dimka88 wrote: ↑06 Jun 2018, 18:02
1. Можно попробовать подгрузить модуль igb/ixgbe с уровнен логирования debug.
2. Попробуйте поднять debian на флэшке, зараннее поставив туда accel и прочие инструменты, и внедрить в ночное время. Поймем в чем проблема: в centos/kernel или в сетевой карте.
ИМХО, всё это будет пустая трата времени..
1. давайте исходить из реалий - если бы проблема была в драйвере, то падали бы ОБА интерфейса.
Плюс отсутствие error/warning во ВСЕХ системных сообщениях, наводит на мысль, что eth0 отправляется в down ШТАТНО,
т.е. типа ifconfig eth0 down. eth1 при этом не затрагивается совсем.
Отсюда предположение, что отключает eth0 либо accel, либо модуль ipoe. И ОС/ядро здесь не при делах..
Может проблема "несогласованности" находится не конкретно в ОС, или драйвере сетевух, а в их настройке?
Вот то, что у меня изменено по сетевым настройкам
Code: Select all
В rc.local:
/sbin/ethtool -K eth0 tso off tx off sg off
/sbin/ethtool -G eth0 rx 2048
/sbin/ethtool -G eth0 tx 2048
#
/sbin/ethtool -K eth1 tso off tx off sg off
/sbin/ethtool -G eth1 rx 2048
/sbin/ethtool -G eth1 tx 2048
#
#
/sbin/ifconfig eth0 txqueuelen 10000
/sbin/ifconfig eth1 txqueuelen 10000
#
В modprobe:
options igb IntMode=2,2 RSS=4,4 InterruptThrottleRate=100000,100000,100000,100000 QueuePairs=0,0,0,0
alias scsi_hostadapter ata_piix
options nf_conntrack hashsize=2097152
alias netdev-eth0 igb
alias netdev-eth1 igb
В sysctl.conf:
net.core.somaxconn=1024
net.ipv4.ip_local_port_range="15000 61000"
net.ipv4.tcp_fin_timeout=30
net.ipv4.tcp_tw_recycle=1
net.ipv4.tcp_tw_reuse=1
net.core.netdev_max_backlog=2000
net.ipv4.tcp_max_syn_backlog=2048
#
net.netfilter.nf_conntrack_acct = 1
net.ipv4.neigh.default.gc_thresh1=2048
net.ipv4.neigh.default.gc_thresh2=4096
net.ipv4.neigh.default.gc_thresh3=16384
#
net.nf_conntrack_max = 16777216
#
#
net.netfilter.nf_conntrack_tcp_max_retrans = 3
net.netfilter.nf_conntrack_tcp_be_liberal = 0
net.netfilter.nf_conntrack_tcp_loose = 3
net.netfilter.nf_conntrack_tcp_timeout_max_retrans = 300
net.netfilter.nf_conntrack_log_invalid = 0
net.netfilter.nf_conntrack_generic_timeout = 600
net.netfilter.nf_conntrack_icmp_timeout = 30
net.netfilter.nf_conntrack_udp_timeout_stream = 180
net.netfilter.nf_conntrack_udp_timeout = 30
net.netfilter.nf_conntrack_tcp_timeout_close = 10
net.netfilter.nf_conntrack_tcp_timeout_time_wait = 120
net.netfilter.nf_conntrack_tcp_timeout_last_ack = 30
net.netfilter.nf_conntrack_tcp_timeout_close_wait = 60
net.netfilter.nf_conntrack_tcp_timeout_fin_wait = 120
net.netfilter.nf_conntrack_tcp_timeout_established = 7200
net.netfilter.nf_conntrack_tcp_timeout_syn_recv = 60
net.netfilter.nf_conntrack_tcp_timeout_syn_sent = 120
net.netfilter.nf_conntrack_checksum = 1
#
#
# ARP tunings
net.ipv4.neigh.default.gc_thresh1=2048
net.ipv4.neigh.default.gc_thresh2=4096
net.ipv4.neigh.default.gc_thresh3=8192
#
Может тут что-то не так "накручено"?
2. К сожалению, с debian-like ОС у меня очень поверхностное знакомство. Все 16 лет практики с *nix прошли на RedHat-like ОС.
Поэтому, накосячить ещё больше в debian мне не составит труда..
P.S. На сейчас хочу попробовать включить в accel log level=5 и заменить ребут в "стороже" на ifconfig eth0 up.. ifconfig eth0.3612.2502 up и т.д. по всем интерфейсам.
P.P.S. А вот это (выделил "красным") не может быть причиной -
ethtool -k eth0
Features for eth0:
rx-checksumming: on
tx-checksumming: off
tx-checksum-ipv4: off
tx-checksum-ip-generic: off [fixed]
tx-checksum-ipv6: off
tx-checksum-fcoe-crc: off [fixed]
tx-checksum-sctp: off
scatter-gather: off
tx-scatter-gather: off
tx-scatter-gather-fraglist: off [fixed]
tcp-segmentation-offload: off
tx-tcp-segmentation: off
tx-tcp-ecn-segmentation: off [fixed]
tx-tcp6-segmentation: off
udp-fragmentation-offload: off [fixed]
generic-segmentation-offload: off [requested on]
generic-receive-offload: on
large-receive-offload: off
rx-vlan-offload: on
tx-vlan-offload: on
ntuple-filters: off [fixed]
receive-hashing: on
highdma: on [fixed]
rx-vlan-filter: on [fixed]
vlan-challenged: off [fixed]
tx-lockless: off [fixed]
netns-local: off [fixed]
tx-gso-robust: off [fixed]
tx-fcoe-segmentation: off [fixed]
tx-gre-segmentation: off [fixed]
tx-udp_tnl-segmentation: off [fixed]
fcoe-mtu: off [fixed]
tx-nocache-copy: on
loopback: off [fixed]
rx-fcs: off [fixed]
rx-all: off [fixed]
tx-vlan-stag-hw-insert: off [fixed]
rx-vlan-stag-hw-parse: off [fixed]
rx-vlan-stag-filter: off [fixed]
Может лучше отключить?