05 运输层

第五章运输层¶

统计信息：字数 16231 阅读33分钟

P57 5.1 运输层概述¶

物理层，数据链路层，网络层解决了异构网络中不同主机的通信，实际上计算机通信的实体是主机中独立的进程。

运输层解决的就是不同主机上的进程之间的通信（端到端协议）。网络层已经解决了底层的通信问题，给上层的运输层的逻辑通信提供服务。

运输层为应用层提供了两个协议：面向连接的 TCP 和无连接的 UDP 协议。

P58 5.2 运输层端口号、复用与分用¶

运输层端口号¶

进程端口号：一个计算机上的进程使用进程端口号（PID）标识。不同操作系统中的进程需要通信，所以需要定制统一的规范。运输层使用端口号区分不同的应用进程。端口号只在本机起到进程的识别，在不同计算机中，相同端口号之间没有联系。

端口号使用16比特表示，取值是0-65535。分成三类：

熟知端口号（世界范围内通用的端口号，HTTP 80端口，DNS 53端口）；
登记端口号（微软到官方机构，登记一下，使用 3389 作为微软远程桌面使用的端口号，MySQL 数据库登记某个端口等等）
短暂端口号（客户端和服务器通信时，会约定一个临时的动态端口，通信结束后，可以释放这个端口号，供其他客户进程使用）

端口复用和分用¶

发送方的端口号复用，接收方的端口号分用。发送方：多个进程通过某个相同的运输层端口通信（不同时或者同时），就是发送方的端口号复用。接收方：某个运输层端口获取到报文后，然后分发给不同的进程，就是接收方的报文分用（不同时或者同时）。

UDP 用户数据报使用 17 协议字段；TCP 报文段使用 6 协议字段。

实例（网络请求）¶

1、浏览器向 DNS 服务器发送请求（baidu.com的IP是什么），UDP 源端口 49152，目的端口 53。运输层将 UDP 用户数据包封装到 IP 数据报。

2、DNS 服务器接收到报文后，响应报文源端口 53，目的端口 49152，发送 DNS 解析后的结果。

3、浏览器接收到报文，获取 IP 地址，然后使用 HTTP 请求，将TCP报文段封装到 IP 数据报中，源端口 49152，目的端口 80 ，报文内容是 baidu.com/index.html

4、百度服务器接收后，相应报文源端口 80，目的端口 49152，返回相应报文。

5、浏览器收到报文，完成请求操作。

期间客户端的 49152 端口实现了端口复用。

P59 5.3 UDP和TCP的对比-重点¶

UDP，User datagram Protocal 用户数据报协议

TCP，Transmission Control Protocal 传输控制协议

主要区别：

连接：UDP 直接无连接，TCP 面向连接，需要三次握手四次挥手。
通信数量：UDP 支持单播多播广播，TCP 仅支持单播。
传输单位：UDP 面向应用层报文（传输过程中，保留报文的边界）。TCP 是面向字节流（实现可靠传输）
可靠性：如果传输有误码，UDP 向上提供无连接不可靠的传输服务，接收方获取误码的报文，仅仅丢弃，其他什么都不做（不可靠），主要适用于IP电话或者视频会议等实时应用（偶尔丢包造成视频掉帧，不会有特别大的影响）最大努力交付，不使用流量控制和拥塞控制。TCP 是可靠信道，不会出现传输差错（误码，丢失，乱序，重复等），适用于可靠传输的应用，例如文件传输（出错了，文件就不能用了），使用流量控制和拥塞控制。
首部长度：UDP仅8字节，开销小（源端口，目的端口，长度，校验），TCP 报文首部字段最小20字节，最大60字节（增加了确认好，窗口，选项等参数）

P60 5.4 TCP的流量控制¶

通常我们希望数据传输的更快一些，如果发送方把数据发送的过快，接收方可能老不及接收，就会造成数据的丢失。

流量控制（flow control）就是让发送方的发送速率不要太快，要让接收方来得及接收。利用滑动窗口算法，可以在 TCP 连接上实现发送方的流量控制。

例子：AB两个主机建立 TCP 连接，A是发送端，B是接收端，B对A实现流量控制，下面是流量控制过程：

A主机默认的发送窗口区间是400
A主机发送了300字节数据
B主机接收到前200字节数据，将200字节确认，最后100字节数据丢失了
B主机流量控制：将接收窗口区间改成300，对主机A进行流量控制（ACK=1，ack=201, rwnd=300）ACK=1 表示确认报文段，ack 表示从201开始接收，rwnd 是接收方的窗口区间是300
A主机调整发送窗口区间到300（可以发送201-500的数据），那么先发送300-400，400-500的数据，然后超时重传旧的200-300的数据（不能发送新的数据了）
B主机接收到200-500的数据后，累计确认，将接收窗口改成100（ACK=1， ack = 501， rwnd = 100）
A主机接收到ACK报文，将发送窗口区间改成100，向右滑动窗口，发送500-600数据
B主机收到600后，把接收窗口改成0（假设B主机的栈内存临时用完了，不能接收新的数据报文了）
A主机把发送窗口改成0，不能再发送数据了。

特殊情况

如果B主机内存有了，将接收窗口改成300，发送给主机A，但是丢包了。此时A主机等待B主机的非零窗口通知，B主机等待A主机发送数据，就形成了死锁
TCP为每一个连接设置一个持续计时器。当持续计时器超时，A主机发送零窗口探测报文（如果B主机还没有内存，就告诉A主机窗口是0）如果没有回复，就断开 TCP 连接。

P61 5.5 TCP的拥塞控制¶

拥塞：网络中资源供小于求，网络资源指的是（带宽，交换节点中的缓存和处理机等）。如果拥塞不控制，造成网络性能变差，网络吞吐量随着输入负荷增大而下降。

理想的吞吐量和输入负载成正比（输入负载增加，吞吐量增加）；实际上拥塞时，吞吐量会大大下降（网络中某些分组被某个节点丢弃）。轻度拥塞时，载入负荷还是和吞吐量正相关。如果无拥塞控制，最后死锁，吞吐量为0，所以需要 TCP 拥塞控制。

拥塞控制四种算法：慢开始、拥塞避免、快重传、快恢复。

讨论拥塞控制时，忽略下面的情况：TCP 假设单向传播，另一个方向确认；接收方和发送方缓存足够大，发送窗口的大小由网络的拥塞程度决定；以MSS最大报文段讨论

慢开始和拥塞控制¶

发送方用 cwnd 拥塞窗口（取决于网络的拥塞程度，动态变化）。只要网络不拥塞，拥塞窗口就增大。当网络出现拥塞，拥塞窗口就减小。

判断网络拥塞的依据：出现超时重传（没有按时收到应当到达的确认报文）

发送方设置 swnd 发送窗口 = cwdn 拥塞窗口

发送方设置一个慢开始门限 ssthresh 当拥塞窗口小于慢开始门限，使用慢开始算法。当拥塞窗口大于 ssthresh 采用拥塞避免算法。当两者相等，两种算法都可以。

例子：慢开始算法，就是N秒传递速度是N-1秒的2倍（2^n），指数规则增加。到达慢开始门限后，使用拥塞避免算法（正比例函数，每次比前一次增加1）

当超时重传时，1、将慢开始门限设置为发生拥塞时拥塞窗口的一半。2、将拥塞窗口减少为1，并重新开始慢开始算法。

慢开始指的是开始很慢（注入的报文段少），并不是增长速度慢。

拥塞避免，并不能完全避免拥塞，而是把拥塞避免算法阶段，把拥塞窗口控制为线性增长，使得网络不容易出现拥塞。

这个算法有例外情况：如果个别报文段丢失，造成超时重传（实际网络没有发生拥塞），这也会成发送方误认为网络拥塞，并更改慢开始门限值和拥塞窗口 = 1，这样降低了传输效率。那么就出现了下面的算法。

快重传和快恢复¶

这两个算法可以改进 TCP 的性能

快重传：让发送方尽早知道个别报文段的丢失，而不是等超时重传计时器超时后才重传报文。要求接收方接收到报文后，不要等自己发送数据时，才捎带确认，而是要立刻发送确认报文。即使收到了失序的报文，也要对已经收到的报文段重复确认。发送方收到3个连续的重复确认，不需要考虑超时重传计时器，直接将相应的报文段立即重传。这样就避免了网络丢包，而不是网络拥塞造成的问题（不会造成超时重传计时器到时间 RTO）。

快恢复算法：发送方如果收到3个重复的确认，说明丢失了个别报文段，不启动慢开始算法，执行快恢复算法。发送方将慢开始门限 ssthresh 和拥塞窗口 cwnd 值调整为当前窗口的一半，开始执行拥塞避免算法。也有的改成新的ssthresh + 3（因为有3个重复的确认，已经有3个报文字段离开了网络）最好看图示

P62 5.6 TCP超时重传时间的选择¶

往返时间 RTT，超时重传时间 RTO，这个和网络性能影响很大。RTO 应该略大于 RTT。实际网络中，RTT 的值是变化的，所以 RTO 也是需要动态计算的，所以这个问题很复杂。

加权平均往返时间 RTTs = （1-a）* RTTs(old) + a * RTT, a 通常是 0.125。RTO 应该略大于 RTTs（这个值更加平滑）

改进后的算法 RTO = RTTs + 4 * RTTd（偏差值得加权平均）

实际上，RTT 测量也比较复杂（如果存在报文的丢失或者重传，计算值就变化）。Karn 算法：如果出现报文重传，不计算这次的 RTT。改进算法：重传一次，把RTO增大一些（典型算法是变成原来的2倍）

P63 5.7 TCP可靠传输的实现¶

TCP基于字节传输，算法是滑动窗口，发送窗口 = min(接收窗口，拥塞窗口)

使用三个指针 p1p2p3 进行滑动窗口

p1 表示已经发送并确认收到的部分（增加，不变）
p3 表示可以发送的部分（p3-p1就是发送窗口）（增加，不变，或者减少——TCP不建议）
p2 在中间，表示可以发送的部分中，已经发送，但是还没有确定收到的部分（p3-p2 有效窗口或者可用窗口）

通常情况下，p1 p2 p3 都不断向前移动。当报文丢失或者发送窗口减小时，调整p1的指向对应的字节序号，实现可靠传输。

可靠传输的实现

发送窗口根据接收窗口设置，但是某个时刻，这两个窗口不一定相等（时延，拥塞）
如果数据不按序到达，接收方先放到临时窗口中，等前面的接收后，按序交付给上层
接收方需要累计确认和捎带确认（减小传输开支）不应该过分延迟确认报文
TCP是全双工通信。双方都有发送窗口和接收窗口，需要区分。

P64 5.8 TCP的运输连接管理—TCP连接建立-三次握手¶

TCP面向连接的协议（TCP报文段）需要三次握手建立连接；传输数据；四次挥手断开连接

TCP 通过三次握手建立连接，目的是让双方都知道存在，协商传输参数（最大窗口值，窗口扩大选项）

TCP服务端和客户端进程先都打开，服务端监听消息

1、客户端发送 TCP 连接请求（SYN=1，seq=x）进入同步已发送状态

2、服务器收到后，进入同步已接收状态，发送 SYN = 1,ACK = 1 seq=y, ack = x+1

3、客户端收到后，进入连接已建立，ACK=1，seq = x + 1, ack = y + 1，服务端收到后建立连接（ack是对上一个seq的确认，ack = seq + 1）

第三次连接不能少的原因：如果第一次连接A发送后，延迟了。又发出了一个连接B，这个连接建立后并释放后，A连接才到达服务端，这样服务端会继续打开，浪费服务端的性能。所以需要第三次连接（为了防止失效的连接请求突然传到服务端，造成错误）。

注意：

1、SYN=1的报文段，不能携带数据，但是消耗一个序号

2、普通的确认报文段，如果不携带数据，不消耗序号

P65 5.8 TCP的运输连接管理—TCP连接释放-四次挥手¶

TCP 通过4报文挥手实现连接释放（断开连接）

1、客户端主动关闭数据传输，发送第一个报文（我已经不发送报文了，可以接收）

2、服务器收到后，发送一个响应报文（好的，服务器端知道了）此时服务器端还可以发送数据。

3、当服务器发送完报文后，被动关闭，发送一个报文（服务端要关闭了）

4、客户端接收到报文后，发送给服务端确认报文（服务端可以关闭了）

5、服务端关闭。客户端等待4分钟后（2MSL，最长报文段寿命，通常是4分钟）关闭状态。

客户端等待2MSL的必要性：避免客户端最后一个报文中途丢失，造成服务端继续发送超时重传报文，造成服务端性能浪费。

保活计时器：TCP服务器端收到数据后，重置报活计时器。如果客户端出现故障，无法发送报文。那么报活计时器一定时间后没有收到数据，就向客户端发送探测报文段，每隔75s发送一个探测报文段。如果发送10个探测报文段无响应，服务器进程就认为客户端进程所在主机故障了，关闭这个TCP连接。

P66 5.9 TCP报文段的首部格式¶

TCP 可靠传输基于面向字节流：发送数据时，从发送缓存中取出全部或者部分数据，然后给其加一个首部成为 TCP 报文段。TCP 的全部功能体现在首部的各字段中。

TCP报文段 = 首部+数据载荷

首部 = 固定首部（20字节）+扩展首部（小于40字节）

首部格式字段

源端口（例如浏览器进程端口号49152）
目的端口（例如服务器端口号80）
序号（当前TCP报文段中，数据载荷的第一个字节的序号）超出 2^32 后重置为0
确认号N：对之前所有收到数据的确认，已经收到N-1之前全部数据（已经正确接收），期望收到下一个TCP序号是N
ACK 确认标志位：如果是1，确认号字段有效；如果是0，确认号字段无效。TCP 规定，连接建立后，所有传送的TCP报文段 ACK 必须是1.
数据偏移：4比特；以四字节为单位。因为TCP报文段有扩展首部，所以首部长度不确定。这个字段指出了TCP报文段的首部长度（TCP数据载荷部分的起始位置距离TCP报文段的起始处的位置）如果TCP首部是20字节，那么数据偏移是 0101，如果首部是 40 字节，那么数据偏移是 1111
保留：目前是0，以后使用
窗口：发送方的接收窗口，接收方根据这个字段，设置发送窗口，进行流量控制。实际上发送窗口 = min(接收窗口，拥塞窗口)
校验和：16比特，检查TCP报文段的首部和数据载荷部分（检测是否有误码等）
SYN（sync）：同步标志位，用于TCP连接建立时同步序号（三次握手需要SYN字段）
FIN（finish）：终止标志位，用于释放TCP连接（四次挥手需要FIN字段）
RST（reset）复位TCP，如果是1，表示TCP连接异常，需要释放连接并重新建立
PSH（push）推送标志位，如果是1，接收方需要尽快上交报文给上层进程，不需要等待接收缓存都填充后再交付。
URG(urgent) 紧急标志位，如果是1，紧急指针字段有效
紧急指针：表明紧急数据的长度。如果发送方有紧急数据，可以将紧急数据插队放到最前面，立即分装成TCP报文段发送。紧急指针表示，本报文中数据载荷中有N长度的紧急数据，后面是普通数据。
其他字段：最大报文段长度MSS（数据载荷最大值），窗口扩大选项（提高吞吐率）；时间戳（计算RTT）；选择确认选项等。
填充：因为其他字段长度可变，为了确保报文段能被4整除（数据首部长度是以4字节为单位的）用空白值填充长度

例如一个报文：序号201；数据载荷长度100字节；确认号800，ACK是1

Last update: November 9, 2024