一、概述 (一)现象 服务器有两个现象,第一是tcp连接数不多,不超过10个,但是time_wait状态的2000。...就是说,谁有TIME-WAIT,谁就是主动方。这点可以排除用户频繁关闭网页的可能。意思就是说这都是服务器主动请求断开连接的,而TIME-WAIT状态的链接也没有回收。...对API的请求是600,对nginx的请求是300,说明所有的TIME-WAIT,一部分是请求nginx的,一部分是nginx请求API的。...可能TIME-WAIT的问题就是后端程序乱发请求,apache是主项目的后端容器,apache-api就是api的后端程序。...而TIME_WAIT不是不回收,而是回收了,但不断的生成。
1.什么是 TCP TIME_WAIT?...2.为什么要 TIME_WAIT?...3.TIME_WAIT 过多的影响 如果客户端(主动发起关闭连接)存在大量 TIME_WAIT 状态连接,会占用端口资源,导致新建 TCP 连接出错,报address already in use :...如果过多的 TIME_WAIT 影响了系统的运行,能通过加机器解决的话就尽量加机器,如果不能解决,我们就需要理解其背后的设计原理并尽可能避免修改默认的配置。...如果服务端要避免过多的 TIME_WAIT 状态的连接,就永远不要主动断开连接,让客户端去断开,由分布在各处的客户端去承受 TIME_WAIT。
TIME_WAIT存在的两个理由: 1 可靠的实现TCP全双工连接的终止 2 允许老的重复的分节在网络上的消逝 第一个:如果客户端不维持TIME_WAIT状态,那么将响应给服务端一个RST,该分节被服务器解释成一个错误...为做到这一点,TCP将不给处于TIME_WAIT状态的连接发起新的化身。...下面主要讨论TIME_WAIT对短连接的影响: 正常的TCP客户端连接在关闭后,会进入一个TIME_WAIT的状态,持续的时间一般在1~4分钟,对于连接数不高的场景,1~4分钟其实并不长,对系统也不会有什么影响...举例来说:假设每秒建立了1000个短连接(Web场景下是很常见的,例如每个请求都去访问memcached),假设TIME_WAIT的时间是1分钟,则1分钟内需要建立6W个短连接, 由于TIME_WAIT...对于应对短连接导致的大量TIME_WAIT连接问题,个人认为第二种处理是最优的选择,libmemcached就是采用这种方式, 从实测情况来看,打开这个选项后,TIME_WAIT连接数为0,且不受网络组网
1070 FIN_WAIT1 17 FIN_WAIT2 247 CLOSING 4 TIME_WAIT 25087 对于网站来说,这样的time_wait略显偏高, 也就是说大量的关闭操作在等待...连接过多的问题,可以通过激活tcp_tw_reuse来缓解。...net.ipv4.tcp_max_tw_buckets = 5000 表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。...此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。...2 ESTABLISHED 972 FIN_WAIT1 21 FIN_WAIT2 152 CLOSING 2 TIME_WAIT 682
1070 FIN_WAIT1 17 FIN_WAIT2 247 CLOSING 4 TIME_WAIT 25087 对于网站来说,这样的time_wait略显偏高, 也就是说大量的关闭操作在等待2个MSL...允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭; net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收...连接过多的问题,可以通过激活tcp_tw_reuse来缓解。...net.ipv4.tcp_max_tw_buckets = 5000 表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。...此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
问题描述 模拟高并发的场景,会出现批量的 time-wait 的 tcp 连接: 短时间后,所有的 time-wait 全都消失,被回收,端口包括服务,均正常。...即,在高并发的场景下,time-wait 连接存在,属于正常现象。...线上场景中,持续的高并发场景: 一部分 time-wait 连接被回收,但新的 time-wait 连接产生; 一些极端情况下,会出现大量的 time-wait 连接; 所以,上述大量的 time-wait...Nginx 作为反向代理时,大量的短链接,可能导致 Nginx 上的 tcp 连接处于 time_wait 状态: 每一个 time_wait 状态,都会占用一个本地端口,上限为 65535(16 bit...为 2 倍的 MSL(报文最大存活时间); time-wait 状态: tcp 连接中,主动关闭连接的一方出现的状态;(收到 FIN 命令,进入 time-wait 状态,并返回 ACK 命令) 保持
日常运维中用netstat -an命令发现服务器中有大量状态为TIME-WAIT的TCP连接,于是用/sbin/sysctl -a查看了一下Linux的各项内核参数,并翻阅有关资料,决定修改其中的两项参数...,以达到减少TCP连接中TIME-WAIT sockets的目的。...允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭; net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收...netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 返回结果如下: ESTABLISHED 1423 FIN_WAIT1... 1 FIN_WAIT2 262 SYN_SENT 1 TIME_WAIT 962 效果:处于TIME_WAIT状态的sockets从原来的10000多减少到1000左右。
TCP TIME_WAIT状态理解: 下面是tcp状态图(来自下面的参考文章): tcp_flow.png 从图中可以看出,若服务器主动关闭连接,在四次挥手的最后一个ACK后连接端口会变为TIME_WAIT...TIME_WAIT状态限制是比较严格的,设置TIME_WAIT状态主要有两个目的: 1、为了防止一个连接的延迟分段被后面新建的连接接收。...从上述两点原因来看, 有TIME_WAIT状态是比较保险的。...---- TCP TIME_WAIT可能出现问题以及参数调整: 当服务器上存在大量连接的时候,TIME_WAIT状态就会变得比较麻烦,连接表里有大量处于TIME_WAIT状态的连接,会导致新的连接不能够建立...为了保证开启选项后, 也能达到TIME_WAIT状态同样的效果,它会记录远程端发来数据的最新时间戳,在TIME_WAIT状态生效期内,放弃所有时间戳小于记录时间戳的包。
TIME_WAIT是怎样产生的? 因为TCP连接是双向的,所以在关闭连接的时候,两个方向各自都需要关闭。先发FIN包的一方执行的是主动关闭; 后发FIN包的一方执行的是被动关闭。...主动关闭的一方会进入TIME_WAIT状态,并且在此状态停留两倍的MSL时长。 什么是MSL? MSL指的是报文段的最大生存时间,如果报文段在网络活动了MSL时间,还没有被接收,那么会被丢弃。...就是一分钟,也就是60秒,并且这个数值是硬编码在内核中的, 也就是说除非你重新编译内核,否则没法修改它: #define TCP_TIMEWAIT_LEN (60*HZ) linux系统下怎样修改TIME_WAIT...允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭; net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets
其中一些错误是因为对TIME_WAIT状态不理解导致的。 在本文中,我将会讲解为什么要存在TIME_WAIT 状态,它的存在所造成的一些问题以及如何解决这些问题。...之所以TIME_WAIT能够影响系统的扩展性是因为在一个TCP连接中,一个Socket如果关闭的话,它将保持TIME_WAIT状态大约 4分钟 。...Windows下并不是这样做的,它只防止完全匹配的处于TIME_WAIT状态的出站连接的建立。 入站连接很少会被TIME_WAIT影响。...但是,累积在服务端的处于TIME_WAIT状态的连接可能会影响性能和资源的使用,因为处于TIME_WAIT状态的连接最终都会超时,这就需要服务器对超时进行处理,并且在TIME_WAIT状态结束之前都会占用服务器的资源...,让TIME_WAIT不再成为问题。
CLOSE_WAIT和TIME_WAIT是如何产生的?大量的CLOSE_WAIT和TIME_WAIT又有何隐患?本文将通过实践角度来带你揭开CLOSE_WAIT和TIME_WAIT的神秘面纱!...遇事不决先祭此图: 稍微补充一点:TIME_WAIT到CLOSED,这一步是超时自动迁移。...- 云主机上原先ESTABLISHED的那条瞬间变成TIME_WAIT了。...TIME_WAIT和CLOSE_WAIT在一些异常条件下,还是会触发的。...并不是说TIME_WAIT就真的无风险,其实无论是TIME_WAIT还是CLOSE_WAIT,永远记住当你的服务出现这两种现象的时候,它们只是某个问题导致的结果,而不是问题本身。
在服务端访问量大的时候检测到大量的time wait,并且接口请求延时较高。...重点说下time_wait、fin_wait_1、fin_wait_2这三个状态: time_wait状态表示收到了对方的FIN报文,并发送出了ACK报文,就等2MSL后即可回到CLOSED可用状态了...如果FIN_WAIT_1状态下,收到了对方同时带 FIN标志和ACK标志的报文时,可以直接进入到TIME_WAIT状态,而无须经过FIN_WAIT_2状态。...方法一、加快time_wait状态回收 此部分可以通过调整内核参数完成 vi /etc/sysctl.conf #表示开启重用,即允许将time_wait socket用于新的tcp连接。...默认是关闭的 net.ipv4.tcp_tw_reuse = 1 #表示开启time_wait的快速回收 net.ipv4.tcp_tw_recycle = 1 #表示如果套接字由本端要求关闭,这个参数决定了它保持在
虽然一个TIME_WAIT网络连接耗费的资源无非就是一个端口、一点内存,但是架不住基数大,所以这始终是一个需要面对的问题。 为什么会存在TIME_WAIT?...如何控制TIME_WAIT的数量? 从前面的描述我们可以得出这样的结论:TIME_WAIT这东西没有的话不行,不过太多可能也是个麻烦事。...tcp_tw_reuse:顾名思义就是复用TIME_WAIT连接。当创建新连接的时候,如果可能的话会考虑复用相应的TIME_WAIT连接。...如果缩小了它,那么系统会将多余的TIME_WAIT删除掉,日志里会显示:「TCP: time wait bucket table overflow」。...参考文档: tcp短连接TIME_WAIT问题解决方法大全(1)——高屋建瓴 tcp短连接TIME_WAIT问题解决方法大全(2)——SO_LINGER tcp短连接TIME_WAIT问题解决方法大全(
time_wait和close_wait tcp连接和关闭中常见的三种状态是: ESTABLISHED 表示正在通信 TIME_WAIT 表示主动关闭 CLOSE_WAIT 表示被动关闭。...有时服务器会在网络状态上出现异常,一半来说是以下两种情况: 服务器保持了大量TIME_WAIT状态 服务器保持了大量CLOSE_WAIT状态 服务器保持了大量TIME_WAIT状态 TIME_WAIT是主动关闭连接的一方...所以主动方要处于 TIME_WAIT 状态,而不能是 CLOSED 。另外这么设计TIME_WAIT 会定时的回收资源,并不会占用很大资源的,除非短时间内接受大量请求或者受到攻击。...当然现代操作系统都会用快速的查找算法来管理这些TIME_WAIT,所以对于新的 TCP连接请求,判断是否hit中一个TIME_WAIT不会太费时间,但是有这么多状态要维护总是不好。...服务器保持了大量CLOSE_WAIT状态 TIME_WAIT状态可以通过优化服务器参数得到解决,因为发生TIME_WAIT的情况是服务器自己可控的,要么就是对方连接的异常,要么就是自己没有迅速回收资源,
19.2 TIME_WAIT 的那些事 19.2.1 描述 我们知道 TCP 在关闭连接的时候,主动断开的一方将处于 TIME_WAIT 状态,并将持续两倍的 MSL。...这个 MSL 在 RFC 793 中的建议是 1 分钟,但是很多系统实现都是 30 秒,所以 TIME_WAIT 的时长也就是 1 分钟。...这个参数实在内核中设置的,如果想修改需要重新编译内核参数,查看可以使用ss 来查看 TIME_WAIT 的剩余存活时长(netstat 也可以 -o 参数) 19.2.2 查看TIME_WAIT $ ss...-nta -o state TIME-WAIT | cat Recv-Q Send-Q Local Address:Port Peer Address:Port...当然,TCP Timer 除了 TIME_WAIT 这种,还有 KEEPALIVE, ON, OFF 三种类型。 19.2.3 查看KEEPALIVE状态 $ netstat -otn ?
TIME_WAIT 定义 我们从上面的图中可以看出来,当 TCP 连接主动关闭时,都会经过 TIME_WAIT 状态。...此时, TIME_WAIT 的存在是为了保证网络中迷失的数据包正常过期。 由以上两个原因,TIME_WAIT 状态的存在是非常有意义的。...时长的确定 由原因来推实现,TIME_WAIT 状态的保持时长也就可以理解了。确定 TIME_WAIT 的时长主要考虑上文的第二种情况,保证关闭连接后这个连接在网络中的所有数据包都过期。...登上服务器一看,果然,有大量的 TIME_WAIT 状态的连接。 但是由于服务器监听的端口会复用,这些 TIME_WAIT 状态的连接并不会对服务器造成太大影响,只是会占用一些系统资源。...小结 当然,高并发情况下,太多的 TIME_WAIT 也会给服务器造成很大的压力,毕竟维护这么多 socket 也是要消耗资源的,关于如何解决 TIME_WAIT 过多的问题,可以看 tcp短连接TIME_WAIT
面试中常问的问题 很多面试中,特别是后端岗位,特别是和服务器相关岗位的面试中喜欢问这两个状态,首先回忆下这两个状态出现的时间,下面是三次握手和四次挥手的状态图 TIME_WAIT TIME_WAIT...是出现在主动关闭的一端,一般是客户端,在收到服务端发来的FIN报文之后进入TIME_WAIT,TIME_WAIT的时间一般是2MSL,1MSL是30秒,主要是等待某些在网络延迟的报文到达,从而正确关闭...那如果服务器这时候出现大量的TIME_WAIT状态,会是什么原因呢 首先出现TIME_WAIT状态是正常的,如果是在服务器出现,那么一般可能是有以下两个原因, 原因 大量的短连接 服务器主动关闭 http...TIME_WAIT状态 第三种就是请求不是一个长连接,如果客户端挂机后,服务器超时会主动断开 所以针对以上情况,有以下解决方法: 解决方法 在业务层尽量避免服务端主动关闭 http请求头设置keep_alive...服务端开启TIME_WAIT复用选项,设置net.ipv4.tcp_reuse=1和net.ipv4.tcp_timestamps=1 大量的TIME_WAIT状态会导致新连接创建失败,因为端口只有65535
Time_wait 啊,老哥们肯定会想,time_wait什么鬼? 为毛我主动断开tcp连接。发完最后一个ACK后不能直接断开连接啊,我能做的都做了。但是….....所以time_wait时间俩个MSL。...所以说time_wait 就是为了防止在连接上有多个重传的FIN包出现,所以必须time_wait这个是为了防止当再一次建立相同的新连接时防止收到老连接的数据包从而导致的影响。...不知道这波解释为什么time_wait,老哥们听懂了没有 对于为什么3次握手?为毛不是2次/4次?
TIME_WAIT ---- 定义 我们从上面的图中可以看出来,当 TCP 连接主动关闭时,都会经过 TIME_WAIT 状态。...此时, TIME_WAIT 的存在是为了保证网络中迷失的数据包正常过期。 由以上两个原因,TIME_WAIT 状态的存在是非常有意义的。...时长的确定 由原因来推实现,TIME_WAIT 状态的保持时长也就可以理解了。确定 TIME_WAIT 的时长主要考虑上文的第二种情况,保证关闭连接后这个连接在网络中的所有数据包都过期。...小结 ---- 当然,高并发情况下,太多的 TIME_WAIT 也会给服务器造成很大的压力,毕竟维护这么多 socket 也是要消耗资源的,关于如何解决 TIME_WAIT 过多的问题,可以看 tcp短连接...TIME_WAIT问题解决方法大全(1)——高屋建瓴。
上篇文章我们简要解析了用户CPU时间相关概念及应用实践,具体可参考链接: Linux系统之User CPU time解析。..., 0 used. 2583448 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME...5、将文件系统磁盘使用率保持在80%以下,以避免过多的碎片。当磁盘碎片过多时,I / O时间将增加。 6、如果上述所有步骤均失败,则我们也可以尝试考虑升级存储以提高性能。
领取专属 10元无门槛券
手把手带您无忧上云