十五年测试老手,长期负责WEB\APP 项目测试,目前主要负责团队管理工作。

CLOSE_WAIT状态 生产过程分析

上一篇 / 下一篇  2011-06-14 22:26:27 / 个人分类:HTTP

CLOSE_WAIT状态

#i3MVNu`0

首先我们知道,如果我们的服务器程序APACHE,nginx,resin处于CLOSE_WAIT状态的话,说明套接字是被动关闭的!

,a+Grhb:@p5r,i:}.D0

因为如果是CLIENT端主动断掉当前连接的话,那么双方关闭这个TCP连接共需要四个packet:51Testing软件测试网k6a|;C4z,@

Client —> FIN —> ServerClient <— ACK <— Server

b1w0\R&Q0L8QE0

这时候Client端处于FIN_WAIT_2状态;而Server 程序处于CLOSE_WAIT状态。

.sJ O)g$kgm0

Client <— FIN <— Server

#F s!uq \8V ^QQ/bB0

这时Server 发送FIN给Client,Server 就置为LAST_ACK状态。51Testing软件测试网1|!I0NrkD l)\

Client —> ACK —> Server51Testing软件测试网F/VmF_p L

Client回应了ACK,那么Server 的套接字才会真正置为CLOSED状态。

7R3Ws&No ]0

Server 程序处于CLOSE_WAIT状态,而不是LAST_ACK状态,说明还没有发FIN给Client,那么可能是在关闭连接之前还有许多数据要发送或者其他事要做,导致没有发这个FIN packet。51Testing软件测试网F m u#x9{ L9V"c

vi /etc/sysctl.conf  添加51Testing软件测试网/BrY3ub-R)zL't-|_S

net.ipv4.tcp_fin_timeout = 351Testing软件测试网6w1J%d+o\

net.ipv4.tcp_keepalive_time = 360

w^x U4NM8]2Q#{0

net.ipv4.tcp_syncookies = 151Testing软件测试网@xeQ!Nk6k

net.ipv4.tcp_tw_reuse = 1

Zf4h6[H9z |0

net.ipv4.tcp_tw_recycle = 151Testing软件测试网$G,F-\Lfl:U&{(d1~M

net.ipv4.ip_local_port_range = 1024    65000

FU? U E;FDW0

net.ipv4.tcp_max_syn_backlog = 8192

Hc#E2ss-le0

net.ipv4.tcp_max_tw_buckets = 5000

8w%?bd9i"~i4i0

执行命令生效

Ar(AC:A0

/sbin/sysctl -p

t Ze1i?0

  说明:51Testing软件测试网b9Mv$tX

  net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;51Testing软件测试网H a0kHAKL4B;`

  net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;51Testing软件测试网4R5yX3KE

  net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。

]KpKh6Ct@S0

  net.ipv4.tcp_fin_timeout = 30 表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间。51Testing软件测试网nfFl"f/a

  net.ipv4.tcp_keepalive_time = 1200 表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。51Testing软件测试网sEN(_N#z

  net.ipv4.ip_local_port_range = 1024    65000 表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。51Testing软件测试网0K3S0J \S&U'Y:E

  net.ipv4.tcp_max_syn_backlog = 8192 表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。51Testing软件测试网Yj1?#r,z&b

  net.ipv4.tcp_max_tw_buckets = 5000 表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。

G5pXPx-f0

linux系统中 /proc/sys/net/ipv4/下各项的意义

&v uNe;eD0

tcp_syn_retries :INTEGER

jY |z"pq|5k$H%S0

默认值是551Testing软件测试网JsfL-]HZ]1@

对于一个新建连接,内核要发送多少个 SYN 连接请求才决定放弃。不应该大于255,默认值是5,对应于180秒左右时间。(对于大负载而物理通信良好的网络而言,这个值偏高,可修改为2.这个值仅仅是针对对外的连接,对进来的连接,是由tcp_retries1 决定的)51Testing软件测试网7ZHo7Kdrt0h

tcp_synack_retries :INTEGER51Testing软件测试网v F;a.fK-Ua%x

默认值是5

pB QRF Q0

对于远端的连接请求SYN,内核会发送SYN + ACK数据报,以确认收到上一个 SYN连接请求包。这是所谓的三次握手( threeway handshake)机制的第二个步骤。这里决定内核在放弃连接之前所送出的 SYN+ACK 数目。不应该大于255,默认值是5,对应于180秒左右时间。(可以根据上面的 tcp_syn_retries 来决定这个值)51Testing软件测试网#jQRlj Z,C A&{+\1j

tcp_keepalive_time :INTEGER

$Y#n*I%Ze)\0

默认值是7200(2小时)51Testing软件测试网9K7[$c m1k"t%iy

当keepalive打开的情况下,TCP发送keepalive消息的频率。(由于目前网络攻击等因素,造成了利用这个进行的攻击很频繁,曾经也有cu的朋友提到过,说如果2边建立了连接,然后不发送任何数据或者rst/fin消息,那么持续的时间是不是就是2小时,空连接攻击? tcp_keepalive_time就是预防此情形的.我个人在做nat服务的时候的修改值为1800秒)51Testing软件测试网/@ r2lU5n:H

tcp_keepalive_probes:INTEGER51Testing软件测试网+Kg%Y/TGu

默认值是9

#U,|_#i6g"U0

TCP发送keepalive探测以确定该连接已经断开的次数。(注意:保持连接仅在SO_KEEPALIVE套接字选项被打开是才发送.次数默认不需要修改,当然根据情形也可以适当地缩短此值.设置为5比较合适)

/C'ZU`8p(sP7P9g v0

tcp_keepalive_intvl:INTEGER

Ae8SN}@2f+l0

默认值为7551Testing软件测试网1a]R cr:{+pB

探测消息发送的频率,乘以tcp_keepalive_probes就得到对于从开始探测以来没有响应的连接杀除的时间。默认值为75秒,也就是没有活动的连接将在大约11分钟以后将被丢弃。(对于普通应用来说,这个值有一些偏大,可以根据需要改小.特别是web类服务器需要改小该值,15是个比较合适的值)

MDwB5t0

tcp_retries1 :INTEGER

*~h;G7@b:G9d,z0

默认值是3

ohg#R$u U1a-_ \0

放弃回应一个TCP连接请求前﹐需要进行多少次重试。RFC 规定最低的数值是3﹐这也是默认值﹐根据RTO的值大约在3秒 – 8分钟之间。(注意:这个值同时还决定进入的syn连接)

7wT EO{(}0

tcp_retries2 :INTEGER

k#~*E8z"d4PV3Ph `4AL0

默认值为1551Testing软件测试网D&h#T,q[2[.@]+s

在丢弃激活(已建立通讯状况)的TCP连接之前﹐需要进行多少次重试。默认值为15,根据RTO的值来决定,相当于13-30分钟(RFC1122规定,必须大于100秒).(这个值根据目前的网络设置,可以适当地改小,我的网络内修改为了5)51Testing软件测试网4j [%wI)cg&p)wIg0{

tcp_orphan_retries :INTEGER51Testing软件测试网7]IRt S(T$`w

默认值是7

%oJ$~~;h,U0

在近端丢弃TCP连接之前﹐要进行多少次重试。默认值是7个﹐相当于 50秒 – 16分钟﹐视 RTO 而定。如果您的系统是负载很大的web服务器﹐那么也许需要降低该值﹐这类 sockets 可能会耗费大量的资源。另外参的考 tcp_max_orphans 。(事实上做NAT的时候,降低该值也是好处显著的,我本人的网络环境中降低该值为3)51Testing软件测试网5LZ0`/Z;Y

tcp_fin_timeout :INTEGER51Testing软件测试网FOJi&KtqQc _

默认值是 60

PoO0CW_i0

对于本端断开的socket连接,TCP保持在FIN-WAIT-2状态的时间。对方可能会断开连接或一直不结束连接或不可预料的进程死亡。默认值为 60 秒。过去在2.2版本的内核中是 180 秒。您可以设置该值﹐但需要注意﹐如果您的机器为负载很重的web服务器﹐您可能要冒内存被大量无效数据报填满的风险﹐FIN-WAIT-2 sockets 的危险性低于 FIN-WAIT-1 ﹐因为它们最多只吃 1.5K 的内存﹐但是它们存在时间更长。另外参考 tcp_max_orphans。(事实上做NAT的时候,降低该值也是好处显著的,我本人的网络环境中降低该值为30)

C-@+Yr5c9HBT0

tcp_max_tw_buckets :INTEGER51Testing软件测试网 YF)}RQ DP#H

默认值是18000051Testing软件测试网'G;}Di'g E(w|

系 统在同时所处理的最大 timewait sockets 数目。如果超过此数的话﹐time-wait socket 会被立即砍除并且显示警告信息。之所以要设定这个限制﹐纯粹为了抵御那些简单的 DoS 攻击﹐千万不要人为的降低这个限制﹐不过﹐如果网络条件需要比默认值更多﹐则可以提高它(或许还要增加内存)。(事实上做NAT的时候最好可以适当地增加该值)51Testing软件测试网Eb+l|E0O

tcp_tw_recycle :BOOLEAN51Testing软件测试网i1|&e.?zLV

默认值是0

/h:e ^1h!C]m$pw0

打开快速 TIME-WAIT sockets 回收。除非得到技术专家的建议或要求﹐请不要随意修改这个值。(做NAT的时候,建议打开它)51Testing软件测试网 u6SIm|3@F

tcp_tw_reuse:BOOLEAN

3`;I`.iOk&TS1w0

默认值是051Testing软件测试网-D}1Ez,J@({

该文件表示是否允许重新应用处于TIME-WAIT状态的socket用于新的TCP连接(这个对快速重启动某些服务,而启动后提示端口已经被使用的情形非常有帮助)51Testing软件测试网/Efg.Y5H7g1nu

tcp_max_orphans :INTEGER51Testing软件测试网Y g sW+` | r7A

缺省值是819251Testing软件测试网W{4B Is

系统所能处理不属于任何进程的TCP sockets最大数量。假如超过这个数量﹐那么不属于任何进程的连接会被立即reset,并同时显示警告信息。之所以要设定这个限制﹐纯粹为了抵御那些简单的 DoS 攻击﹐千万不要依赖这个或是人为的降低这个限制(这个值Redhat AS版本中设置为32768,但是很多防火墙修改的时候,建议该值修改为2000)

H8ri O tG |4U0

tcp_abort_on_overflow :BOOLEAN51Testing软件测试网~.q7f5x%{+AQ

缺省值是051Testing软件测试网C)clJ Y

当守护进程太忙而不能接受新的连接,就象对方发送reset消息,默认值是false。这意味着当溢出的原因是因为一个偶然的猝发,那么连接将恢复状态。只有在你确信守护进程真的不能完成连接请求时才打开该选项,该选项会影响客户的使用。(对待已经满载的sendmail,apache这类服务的时候,这个可以很快让客户端终止连接,可以给予服务程序处理已有连接的缓冲机会,所以很多防火墙上推荐打开它)51Testing软件测试网8z4E1W,hAz [6e

tcp_syncookies :BOOLEAN51Testing软件测试网/c-XdW;}'GAn#W

默认值是0

5@eZeUem0

只有在内核编译时选择了CONFIG_SYNCOOKIES时才会发生作用。当出现syn等候队列出现溢出时象对方发送syncookies。目的是为了防止syn flood攻击。51Testing软件测试网0tp'_#L S a s

注意:该选项千万不能用于那些没有收到攻击的高负载服务器,如果在日志中出现synflood消息,但是调查发现没有收到synflood攻击,而是合法用户的连接负载过高的原因,你应该调整其它参数来提高服务器性能。参考:51Testing软件测试网%Xn OC}'v9Q)j V[

tcp_max_syn_backlog

"Z/D$`.M7j'X Pt0

tcp_synack_retries51Testing软件测试网^@v;\e-h*Sg

tcp_abort_on_overflow51Testing软件测试网\ ozk%TV

syncookie严重的违背TCP协议,不允许使用TCP扩展,可能对某些服务导致严重的性能影响(如SMTP转发)。(注意,该实现与BSD上面使用的tcp proxy一样,是违反了RFC中关于tcp连接的三次握手实现的,但是对于防御syn-flood的确很有用.)51Testing软件测试网|9Q3dd Y([1GP

tcp_stdurg :BOOLEAN

f"IBy8N%T;d[aL^0

默认值为051Testing软件测试网k7E8o5eXbPh

使用 TCP urg pointer 字段中的主机请求解释功能。大部份的主机都使用老旧的 BSD解释,因此如果您在 Linux 打开它﹐或会导致不能和它们正确沟通。

x z J]ui C/O0

tcp_max_syn_backlog :INTEGER

g7C5qn"iq2OS0

对于那些依然还未获得客户端确认的连接请求﹐需要保存在队列中最大数目。对于超过 128Mb 内存的系统﹐默认值是 1024 ﹐低于 128Mb 的则为 128。如果服务器经常出现过载﹐可以尝试增加这个数字。警告﹗假如您将此值设为大于 1024﹐最好修改 include/net/tcp.h 里面的 TCP_SYNQ_HSIZE ﹐以保持 TCP_SYNQ_HSIZE*16<=tcp_max_syn_backlog ﹐并且编进核心之内。(SYN Flood攻击利用TCP协议散布握手的缺陷,伪造虚假源IP地址发送大量TCP-SYN半打开连接到目标系统,最终导致目标系统Socket队列资源耗 尽而无法接受新的连接。为了应付这种攻击,现代Unix系统中普遍采用多连接队列处理的方式来缓冲(而不是解决)这种攻击,是用一个基本队列处理正常的完 全连接应用(Connect()和Accept() ),是用另一个队列单独存放半打开连接。这种双队列处理方式和其他一些系统内核措施(例如Syn-Cookies/Caches)联合应用时,能够比较有效的缓解小规模的SYN Flood攻击(事实证明<1000p/s)加大SYN队列长度可以容纳更多等待连接的网络连接数,所以对Server来说可以考虑增大该值.)51Testing软件测试网#x AB!^#N}

tcp_window_scaling :INTEGER 缺省值为1 该 文件表示设置tcp/ip会话的滑动窗口大小是否可变。参数值为布尔值,为1时表示可变,为0时表示不可变。tcp/ip通常使用的窗口最大可达到 65535 字节,对于高速网络,该值可能太小,这时候如果启用了该功能,可以使tcp/ip滑动窗口大小增大数个数量级,从而提高数据传输的能力(RFC 1323)。(对普通地百M网络而言,关闭会降低开销,所以如果不是高速网络,可以考虑设置为0)51Testing软件测试网P&N#IyR2U&P1p9~$\

tcp_timestamps :BOOLEAN 缺省值为1 Timestamps 用在其它一些东西中﹐可以防范那些伪造的 sequence 号码。一条1G的宽带线路或许会重遇到带 out-of-line数值的旧sequence 号码(假如它是由于上次产生的)。Timestamp 会让它知道这是个 ‘旧封包’。(该文件表示是否启用以一种比超时重发更精确的方法(RFC 1323)来启用对 RTT 的计算;为了实现更好的性能应该启用这个选项。)

D8s$| p3fRs0

tcp_sack :BOOLEAN 缺省值为1 使 用 Selective ACK﹐它可以用来查找特定的遗失的数据报— 因此有助于快速恢复状态。该文件表示是否启用有选择的应答(Selective Acknowledgment),这可以通过有选择地应答乱序接收到的报文来提高性能(这样可以让发送者只发送丢失的报文段)。(对于广域网通信来说这个选项应该启用,但是这会增加对 CPU 的占用。)

hA+Uw/RQ"IG'W1y0

tcp_fack :BOOLEAN 缺省值为1 打开FACK拥塞避免和快速重传功能。(注意,当tcp_sack设置为0的时候,这个值即使设置为1也无效) tcp_dsack :BOOLEAN 缺省值为1 允许TCP发送”两个完全相同”的SACK。

C SKm_p&CD0

cp_ecn :BOOLEAN 缺省值为0 打开TCP的直接拥塞通告功能。51Testing软件测试网0B$@n;BXle

tcp_reordering :INTEGER 默认值是3 TCP流中重排序的数据报最大数量。 (一般有看到推荐把这个数值略微调整大一些,比如5)51Testing软件测试网 A0o8Y2}!M1B TF

tcp_retrans_collapse :BOOLEAN 缺省值为1 对于某些有bug的打印机提供针对其bug的兼容性。(一般不需要这个支持,可以关闭它) tcp_wmem(3个INTEGER变量): min, default, max min:为TCP socket预留用于发送缓冲的内存最小值。每个tcp socket都可以在建议以后都可以使用它。默认值为4096(4K)。 default:为TCP socket预留用于发送缓冲的内存数量,默认情况下该值会影响其它协议使用的net.core.wmem_default 值,一般要低于net.core.wmem_default的值。默认值为16384(16K)。 max: 用于TCP socket发送缓冲的内存最大值。该值不会影响net.core.wmem_max,”静态”选择参数SO_SNDBUF则不受该值影响。默认值为131072(128K)。(对于服务器而言,增加这个参数的值对于发送数据很有帮助,在我的网络环境中,修改为了51200 131072 204800)

rq&f)V#?Z ^U Q5l0

tcp_rmem (3个INTEGER变量): min, default, max min:为TCP socket预留用于接收缓冲的内存数量,即使在内存出现紧张情况下tcp socket都至少会有这么多数量的内存用于接收缓冲,默认值为8K。 default:为TCP socket预留用于接收缓冲的内存数量,默认情况下该值影响其它协议使用的 net.core.wmem_default 值。该值决定了在tcp_adv_win_scale、tcp_app_win和tcp_app_win=0默认值情况下,TCP窗口大小为65535。默认值为87380 max:用于TCP socket接收缓冲的内存最大值。该值不会影响

0z2o]2q#}9Q0

net.core.wmem_max,”静态”选择参数 SO_SNDBUF则不受该值影响。默认值为 128K。默认值为87380*2 bytes。(可以看出,.max的设置最好是default的两倍,对于NAT来说主要该增加它,我的网络里为 51200 131072 204800)51Testing软件测试网.NDY6e[

tcp_mem(3个INTEGER变量):low, pressure, high low:当TCP使用了低于该值的内存页面数时,TCP不会考虑释放内存。(理想情况下,这个值应与指定给 tcp_wmem 的第 2 个值相匹配 – 这第 2 个值表明,最大页面大小乘以最大并发请求数除以页大小 (131072 * 300 / 4096)。 ) pressure:当TCP使用了超过该值的内存页面数量时,TCP试图稳定其内存使用,进入pressure模式,当内存消耗低于low值时则退出pressure状态。(理想情况下这个值应该是 TCP 可以使用的总缓冲区大小的最大值 (204800 * 300 / 4096)。 ) high:允许所有tcp sockets用于排队缓冲数据报的页面量。(如果超过这个值,TCP 连接将被拒绝,这就是为什么不要令其过于保守 (512000 * 300 / 4096) 的原因了。 在这种情况下,提供的价值很大,它能处理很多连接,是所预期的 2.5 倍;或者使现有连接能够传输 2.5 倍的数据。 我的网络里为192000 300000 732000) 一般情况下这些值是在系统启动时根据系统内存数量计算得到的。

&hBX#]:n U+Q0

tcp_app_win : INTEGER 默认值是31 保留max(window/2^tcp_app_win, mss)数量的窗口由于应用缓冲。当为0时表示不需要缓冲。51Testing软件测试网)} ?#I&Sx?(]&?r~7d

tcp_adv_win_scale : INTEGER 默认值为2 计算缓冲开销bytes/2^tcp_adv_win_scale(如果tcp_adv_win_scale > 0)或者bytes-bytes/2^(-tcp_adv_win_scale)(如果tcp_adv_win_scale <= 0)。51Testing软件测试网 [|9^$Y`8Pq

tcp_rfc1337 :BOOLEAN51Testing软件测试网IV'F UW

缺省值为051Testing软件测试网)Wy6B{/Ap[7h

这个开关可以启动对于在RFC1337中描述的”tcp 的time-wait暗杀危机”问题的修复。启用后,内核将丢弃那些发往time-wait状态TCP套接字的RST 包.51Testing软件测试网"v3u&qOeQx"O:y Q*n

tcp_low_latency : BOOLEAN51Testing软件测试网R.[;}t-Ju2tb

缺省值为0

gsdp!G+UqM0

允许 TCP/IP 栈适应在高吞吐量情况下低延时的情况;这个选项一般情形是的禁用。(但在构建Beowulf 集群的时候,打开它很有帮助)51Testing软件测试网*{!]X,v'YRCQ

tcp_westwood :BOOLEAN

`%Km ~p U0

缺省值为0

Xe4P:Zx+WS.v6L8C.u0

启用发送者端的拥塞控制算法,它可以维护对吞吐量的评估,并试图对带宽的整体利用情况进行优化;对于 WAN 通信来说应该启用这个选项。51Testing软件测试网 E&`!{?m,z

tcp_bic :BOOLEAN51Testing软件测试网 i4E \$T&Gs

缺省值为0

7Q8UULF JU9I0

为快速长距离网络启用 Binary Increase Congestion;这样可以更好地利用以 GB 速度进行操作的链接;对于 WAN 通信应该启用这个选项。51Testing软件测试网4GE-Z)J%hH/V a/Gb


TAG: CLOSE_WAIT状态

 

评分:0

我来说两句

Open Toolbar