摘要
重传机制
TCP重传机制主要是为了防止网路包丢弃,重传的工作方式主要借助TCP头部中的序列号和确认号来决定是否重传,重传的触发方式主要由以下几种:
超时重传
什么是超时重传?
发送方在发送数据时设置一个定时器,当超过指定时间后如果还没有收到接收方的ACK响应,就会重发数据包。
超时重传的发生场景
什么是RTT?什么是RTO?
RTT就是数据包的往返时间,RTO就是超时重传时间。
RTO的长短对数据包的重传有什么影响?
RTO如何设置?
RTO既不能过长也不能过短,略微大于RTT是最好的。但RTT会因为网络的变化而发生变化,所以在Linux系统中为了计算RTO,会对RTT进行两个采样:
RFC6289建议使用以下公式计算RTO:
# 首次计算RTO,R1为第一次测量的RTT
SRTT = R1
DevRTT = R1/2
RTO = μ * SRTT + δ * DevRTT = μ * R1 + δ * (R1/2)
# 后续计算RTO,R2为新测量的RTT
# SRTT是平滑的RTT值
SRTT = SRTT + α * (RTT - SRTT) = R1 + α * (R2 - R1)
# DevRTT是平滑的RTT和当前的RTT之间的差值
DevRTT = (1 - β) * DevRTT + β * (|RTT-SRTT|)= (1 - β) * (R1/2) + β * (R2 - R1)
RTO = μ * SRTT + δ * DevRTT
上述表达式中,在linux中α = 0.125,β = 0.25,μ = 1,δ = 4,至于为啥是这些值,别问问就是前人大量的测试积累得出。
假设因为网络阻塞触发了超时,如何避免频繁重发加剧网络阻塞?
超时时间加倍,就是每当重传的时候,都会将下一次的超时时间设置为当前值的两倍,避免频繁重发导致网络更加阻塞。
超时重传的弊端是什么?
超时周期可能相对较长,重传的等待时间可能过长。
快速重传
什么是快速重传?
快速重传不再以时间作为重传的标准,而是以数据作为重传的标准。
上述Seq2因为某些原因没有抵达接收方,但接收方已经收到了Seq3、4、5的数据包,并且回复了三次ACK2的数据包。发送端在收到三次ACK2的数据包以后,就会在超时定时器之前重传Seq2的数据包。
重传所有包还是重传丢失的包?
由于发送端并不知道三次ACK2的数据包是由发送方的哪几个数据包响应回来的(也就是Seq3、4、5),因此只重传Seq2还是要重传所有的数据包也是个问题。
根据TCP实现的不同,上述两种情况都可能存在。
SACK重传
SACK重传其实就是选择性重传,它是为了解决快速重传不知道需要重传哪些包的问题。
SACK是如何让发送方知道重传哪些包的?
TCP的选项字段增加一个SACK字段,接收方会将已经收到数据包序列号范围发送给发送方,这样发送方通过SACK信息就能找到丢失的数据包重传此数据包。
SACK的使用条件
SACK必须要发送方和接收方同时支持,在linux中可以通过net.ipv4.tcp_sack参数开启(Linux2.4以后默认开启)。
Duplicate SACK(D-SACK)
SACK可以让发送方准确的知道哪些数据包接收方没有收到,而D-SACK可以让发送方知道有哪些数据包被重复接收了。
D-SACK的优点是什么?
D-SACK如何让发送方知道ACK包丢失
上图中接收方收到了3000~3999的数据包,但回应的ACK发生了丢失,假设此时触发了超时重传,发送方会首先重传3000~3499的数据包,接收方在收到该包以后发现该包已经被接收过了,于是会回复一个SACK = 3000~3500告诉发送方该数据包已经被接受过了,因为ACK已经到4000了,所以这里是一个D-SACK。发送方在收到报文以后可以知道数据包没有丢,丢的只是ACK报文。
D-SACK如何让客户端知道数据包发送延时
上图中1000~1499的数据包被网络延迟,后续发送方收到了三个连续ACK 1000的报文触发了超时重传,重传以后,延时的网络包也抵达了接收方,此时接收方会回复一个SACK=1000~1500,因为ACK已经到了3000,所以这里是一个D-SACK,表示收到了重复的包。发送方收到了该ACK报文以后也可以判断出快速重传的原因是因为网络延迟。
如何开启D-SACK
在Linux下可以通过net.ipv4.tcp_dsack参数开启/关闭这个功能(Linux 2.4后默认打开)。