背景
最近发现业务POD使用短连接过程中,端口被耗尽,一系列操作。
方案
- 扩大端口数量
- 降低单pod配置,横向扩容pod个数
- 改成长链接
- 调整内核参数
扩大端口数量
pod新增内核参数
net.ipv4.ip_local_port_range = 1024 65535
横向扩容
如果上述修改端口限制无法解决你的问题,那么能快速解决问题的方法就是降低你单pod规格,使得pod个数增加,分担端口压力。
修改成长链接
改这个,也需要你业务支持,编程语言有比较好的支持。
调整内核参数
这两个参数配合使用,reuse能复用time_wait端口
net.ipv4.tcp_timestamps=1 # 与tw_reuse一起用
net.ipv4.tcp_tw_reuse=1
这个参数没必要开tcp_rw_recycle
额外说一句
有同学说修改这个参数tcp_fin_timeout
,字面意思是缩短time_wait的时间,加速端口回收,其实没啥*用,看看内核源码,就知道默认6