06 应用层

第六章应用层¶

统计信息：字数 17362 阅读35分钟

6.1 应用层概述¶

计算机网络的下层实现，都是为应用层做基础工作；应用层的功能复杂，协议很多。这一张每一节会介绍不同功能的具体使用和对应的协议。

物理层：解决使用何种信号来传递比特流的问题

数据链路层：解决分组在一个网络或者一段链路上传输的问题

网络层：解决分组在多个网络上传输路由的问题

运输层：解决进程之间基于网络的通信问题

应用层：解决通过应用进程的交互来实现特定网络应用的问题

应用层：计算机体系结构最顶层；设计和建立计算机网络的最终目的

6.2 客户端—服务器方式和对等方式-BS 和 P2P¶

CS 模式：客户端和服务器：是进程之间服务和被服务的关系（WWW，FTP，POP3）。

客户是服务请求方，服务器是服务提供方。服务器始终运行，并等待客户的服务请求。服务器有固定的端口号，运行服务器的主机也有固定的IP地址。

CS的服务是服务集中型的，客户端比较多，服务器比较少。通常一台服务器为多个客户端提供服务，可能出现服务器跟不上多个客户端请求的情况，所以使用集群或者服务器场来构建强大的虚拟服务器。

P2P 没有固定的服务请求者和服务提供者，网络中各个P2P应用程序是对等的，对等方之间直接通信，每一个对等方是服务的请求者和提供者（文件共享，迅雷）。

P2P是服务分散型的，服务不是集中在少数几个服务器计算机中，而是分散在大量对等计算机中。特点：可扩展性好，增加对等方时，同时增加服务的提供者和请求者，系统性能不会因为规模扩大而降低，这样成本上有优势，不需要更多的服务器设施和服务器带宽。

6.3 动态主机配置协议DHCP¶

实际的问题：如果一个局域网中多个主机，如何配置IP，才能使得客户主机正常访问服务器？可以手动配置，但是配置比较麻烦。DHCP 动态主机配置协议就是自动配置 IP 的服务。在局域网中增加一个 DHCP 服务器提供服务。客户向 DHCP 服务器请求自己的网络配置信息即可。

DHCP 提供了即插即用联网：允许一台计算机，加入新网络时，可自动获取IP地址等网络配置信息，而不是上手动参与（Dynamic Host Configuration Protocol）。

DHCP 报文在运输层封装成 UDP 用户数据报。客户端通过 UDP 68 端口发送报文，服务器通过 UDP 67 端口接收报文。

获取 IP 阶段¶

1、客户端发送 DISCOVER 报文（广播发送，源地址 0.0.0.0 目的地址 255.255.255.255）

2、服务器接收报文，并发出响应 OFFER 报文（源地址是服务器的地址，目的地址是 255.255.255.255）包括事务ID和配置信息（IP地址，子网掩码，地址租期，默认网关，DNS服务器信息）DHCP服务器从自己的 IP 地址池中选择待租用给主机的 IP 地址。使用 ARP 确保选中的 IP 没有被其他主机占用。

3、客户端可能收到多个 DHCP 服务器发送的 OFFER 报文，选择先到的报文。

4、客户端继续广播 REQUEST 报文（包括事务ID，DHCP客户端的MAC地址，接收租约中的IP地址，提供租约的DHCP服务器端的IP地址）源地址 0.0.0.0 目的地址 255.255.255.255

4、服务器收到报文后，发送 ACK 报文。客户端接收后，使用 ARP 检测分配的 IP 地址是否被网络的其他主机占用。如果占用，给 DHCP 发送 DECLINE 撤销报文，然后从第一步重新发送 DISCOVER 报文。如果没有占用，可以使用这个 IP 地址和其他主机进行通信了。

IP 续约阶段（当0.5倍租用期到了）¶

1、客户端给服务器发送 REQUEST 报文（源地址是租用的IP地址，目的地址是服务器的地址）

2、服务器接收到报文后：如果可以续约，发出 ACK 报文（源地址是服务器地址，目的地址是租用的 IP 地址），得到新的租用期；如果不可以续约，发出 NACK 报文，客户端必须停止使用之前租用到的 IP 地址，重新发送 DISCOVER 报文获取IP。

3、如果服务器无响应，0.875倍租用期到达后，客户端继续发送 REQUEST 报文，如果继续无响应，在租用期到达后停止使用 IP 并重新发送 DISCOVER 报文。

客户端主动解除IP续约¶

1、客户端向 DHCP 服务器发送 RELEASE 释放报文（源地址0.0.0.0，目标地址 255.255.255.255）

路由器中继问题：如果一个主机在路由器后面，路由器外面配置 DHCP 服务器，那么这个主机不能自动获取 IP 地址。主机会发出 DISCOVER 报文，但是会被路由器丢弃，服务器无法获取到。所以路由器需要配置 DHCP 服务器的地址并成为中继代理，这样就可以获取 IP 和网络配置信息了。

实际上，我们不需要，也不愿意在每一个网络上都配置 DHCP 服务器，所以每一个网络至少设置一个 DHCP 中继代理（路由器），作为各个网络中计算机和 DHCP 服务器的桥梁。

6.4 域名系统DNS¶

域名的作用：用户不需要记住IP地址，只需要记住域名，通过域名解析，访问到 IP 地址。域名系统简单说，就是一个域名和IP对应的哈希表服务。

域名的原理：客户端访问某个域名时，先从本地的 DNS 高速缓存中查找该域名对应的 IP 地址。如果本地没有找到，那么就向 DNS 服务器发送请求，获取 IP 地址。

服务器数量：互联网上不可能只有一台 DNS 服务器，扛不住高并发请求。如果这一台奔溃了，整个网络就挂了。

服务器结构：实际上 DNS 是层级的树结构，分布式的域名系统。大部分域名在本地解析，少量需要在网络中解析，效率很高。因为是分布式，即使某个计算机出现故障，不会影响整个系统运行。

域名树：三级域名.二级域名.一级域名每一级由英文字母和数字组成（不超过63个字符，不区分大小写字母，左边低右边高，完整域名不超过255个字符）DNS 不显示一个域名有多少下级域名，不限制每一级域名代表什么意思。顶级域名由ICANN管理，各级域名由上一级的域名管理机构管理（dev.jlu.edu.cn）

顶级域名：国家顶级域名（cn us uk）通用顶级域名（com net org edu）反向域 arpa。二级域名由国家自行确定。域名只是逻辑概念，不代表真实的物理地址。

域名服务器分类：

根域名服务器（13个服务器集群，不解析域名，返回该域名所属的顶级域名服务器的IP地址）
顶级域名服务器：负责管理在顶级域名服务器（cn）注册的全部二级域名（edu, bj）收到 DNS 查询请求时，可以回答。可能是最后的结果，也可是下一级权限域名服务器的IP
权限域名服务器：管理某个区的域名
本地域名服务器：主要是代理作用。主机发出 DNS 请求报文时，首先发送到本地域名服务器（大学或者ISP），一半不超过几个路由器。本地域名服务器的IP地址直接配置在主机中。

域名解析过程：递归查询迭代查询

递归查询：从底层一直到上层查询，上层依次返回查询结果。A -> B -> C -> D -> C -> B -> A 被查询的服务器负担较大，性能不好。
迭代查询：主机箱本地域名服务器查询。本地先向根域名查询，上一层返回结果。如果不存在，然后底层向上两级查询，上两级返回结果。本地域名服务器 -> 根域名(cn) -> 本地, 本地 -> 顶级(edu) -> 本地, 本地 -> 权限(jlu) -> 本地。如果中间有缓存，那么直接获取缓存。
实际上，主机到本地域名服务器使用递归查询，其他的查询时迭代查询。

高速缓存：用来存放最近查询过得域名，以及从何处获取域名映射信息的记录。因为域名到 IP 的映射关系可能变化，域名服务器会设置计时器和过期时间（每个项目存放两天）

例题

如果本地域名服务器无缓存，使用递归方法解析另一个网络的主机域名时，用户主机发送1条请求，本地域名服务器发送1条请求。

如果本地域名服务器有缓存，使用递归方法解析另一个网络的主机域名时，用户主机发送1条请求，本地域名服务器发送0条请求。

如果本地域名服务器有缓存，使用迭代方法解析另一个网络的主机域名时，用户主机发送1条请求，本地域名服务器发送3-4条请求。

解析 www.taobao.com.cn 时，本地域名服务器可能发出的请求最多和最少是：最少0条（本地域名服务器有缓存）最多4条（根域名服务器，顶级域名cn 权限域名com.cn 权限域名 taobao.com.cn）

6.5 文件传送协议FTP¶

计算机网络中传输文件是基本的网络应用，使用FTP协议。

三个特点：1、FTP 屏蔽了计算机网络中的很多内部细节，不同结构的网络可以正常通信。2、提供交互式的访问。用户可以指定传输文件的类型和格式，可以设置文件的存取权限。3、早期使用非常多，最后逐步被 www 取代。

服务器硬件配置：根据需求不同，FTP服务器可能是高性能和高可靠性的服务器计算机，也可能是普通的个人计算机。

客户端软件配置：可以使用FTP软件；可以直接在浏览器中使用 ftp 协议获取文件；可以在终端中使用 ftp：地址进行登录（dir get put 等命令进行发送接收文件）

用途：计算机之间批量传输文件，或者网页设计中，把本地文件上传到 web 服务器上。

工作原理：TCP 端口21。

1、客户端随机端口号发起 TCP 控制连接，服务器21端口接收报文。这个 TCP 连接成为控制连接。控制连接在整个对话期间始终打开，传输 FTP 的控制命令。

2、只有在有数据要传输时，客户端另一个随机端口发出 TCP 数据连接，默认情况下服务器 20 端口接收报文。这个连接就是数据连接，传输结束就关闭。

连接方式：控制连接和数据连接。

传输模式：主动模式和被动模式。建立数据连接后，主动模式中服务器主动连接客户端，被动模式下，服务器被动等待客户端的连接。主动方式使用 TCP 20 端口，被动方式下端口号由服务器和客户端自行商议决定。

6.6 电子邮件¶

电子邮件：发件人把邮件从本地发到邮件服务器，发件人的邮件服务器根据收件地址，转发到收件人的邮件服务器。收件人方便时，访问邮件服务器，获取收到的电子邮件。不仅可以传递文本，还支持多媒体。

传输方式：客户端/服务器方式

用户代理：用户与电子邮件系统的接口（客户端软件）

邮件服务器：ISP都有邮件服务器，负责发送和接收邮件，同时负责维护用户的邮箱

协议：使用 SMTP 发送邮件，使用 POP3 接收邮件

SMTP协议¶

SMTP 基本原理：A邮件服务器周期性对邮件缓存扫描，如果有新的邮件就开始发送。SMTP 有 14条命令，应答模式有 21种，使用 25 端口。简化的流程如下：

- 客户端向服务器说明身份，告诉 SMTP 服务器的域名。如果有效，服务器返回 250
- 客户端告诉服务器邮件的发件人。如果有效，返回 250
- 客户端告诉服务器邮件的收件人。如果邮箱存在，返回250。错误就返回其他的代码
- 客户端告诉服务器准备发送正文。服务器如果准备好接收，返回 354。
- 客户端发送邮件内容
- 客户端发完邮件内容，发送结束符号。如果收件成功，返回 250
- 客户端向服务器请求断开连接，服务器返回 211，并主动断开连接

邮件的格式：信封+内容（首部+主体）首部包括：from to CC subject

SMTP 的不足：只能传输 ASCII 码的文本数据，不能传输 exe 或者其他二进制对象；不能传送多媒体文件，不能传输非英文。

为了传输非 ASCII 码文本的问题，提出了多用途因特网邮件扩展 MIME。就是发件和收件前，先把多媒体转换成 ASCII 码，收件后，将 ASCII 反向转换成多媒体文件。MIME 也用于 HTTP 请求中，多媒体转换成 ASCII 的问题。

MIME：1、增加了5个新的邮件首部字段（提供了邮件主体的信息）。2、定义了许多邮件内容的格式（对多媒体邮件进行标准化）3、定义了传输编码，对任何内容格式进行转换。

POP3协议¶

POP 协议，3表示第三个版本，是因特网的正式标准，功能简单有限（用户只能下载到本地，管理邮件）

用户只能下载并删除，或者下载并保留的方式，从邮件服务器下载到本地计算机，不允许在邮件服务器上管理自己的邮件（不支持创建文件夹和管理自己的邮件）。

IMAP协议¶

当前是 IMAP4 ，功能强大，是因特网的建议标准（用户可以在服务器上管理自己的邮件）是一个联机协议。

POP3和IMAP4都基于 TCP 连接的客户端服务器模式，POP3使用110 端口，IMAP使用143端口。

基于WWW的电子邮件¶

通过浏览器登录操作电子邮件，和 IMAP 类似，无需本地安装专门的用户代理程序，此时用户A到A服务器之间使用 HTTP 协议，A服务器到B服务器使用 SMTP 协议，B服务器到B浏览器使用HTTP协议即可。

6.7 万维网WWW¶

万维网是互联网上分布式应用，通过超链接将不同网页连接起来的网络。

浏览器内核（渲染引擎）负责网页的解析和显示。不同浏览器的内核不同，解析显示代码的结果不同，造成了浏览器兼容性问题。

URL：统一资源定位符，协议：主机：端口、路径

HTTP 1.0 版本：非持续连接的方式：每次请求需要建立 TCP 连接，请求结束后，断开连接。请求一个文件需要 2RTT + 文件传输时间（TCP三次握手）。如果并行请求资源，那么TCP连接较多，对服务器的性能影响较大。

HTTP 1.1 版本：持续连接。TCP建立连接后，服务器发送相应后，仍然保持TCP连接，同一个浏览器后续的 HTTP 请求仍然使用这个连接，只要请求的资源在同一个服务器上即可。这样大大减少了 TCP 请求的数量。TCP 持续连接以流水线形式工作，即浏览器异步发送请求，可以连续发送多个请求报文，多个连续报文到达服务器后，服务器发回多个响应报文，这样节省了很多 RTT 时间，使 TCP 连接中空闲时间减少。

TCP 连接的端口号默认是 80 端口

HTTP 报文是面向文本的，其中每一个字段都是 ASCII 串码，每个字段长度都不是固定的。

请求报文：
请求行：方法 + URL + 版本
首部行：字段名+值 （可能有多个字段）
实体主体：通常不用

GET /index.html HTTP/1.1
Host: www.baidu.com (服务器的域名)
Connection: close/keep-alive （服务器发送相应后，可以释放连接）
User-Agent: Mozilla/5.0（浏览器类型和版本）
Accept-Language: cn（用户优先获取中文版本的文档）
该 HTTP 请求没有实体主体

请求方法：get、post、head、put、delete、connect、options、trace、patch

响应报文
状态行：版本+状态码+短语
首部行：字段名+值

状态码

1xx 请求收到，正在进行处理
2xx 请求成功
3xx 重定向，完成请求还必须采取进一步行动
4xx 客户端错误
5xx 服务器错误

使用 cookie 在服务器上记录用户信息：网页需要记住用户名，具体流程

浏览器带着 userID 发出 HTTP 请求
服务器端根据 userID，生成一个唯一的 Cookie，在服务器端数据库创建一个项目，记录用户访问网站的各种信息
服务器返回 set-Cookie 字段
浏览器将 cookie 存入文件
浏览器再次请求时，在请求中带入 cookie
服务器根据 cookie，识别用户，返回个性化的用户网页
浏览器解析个性化的网页

万维网缓存（web 缓存）：使用缓存机制，提高网络效率。请求可以缓存到本地客户端，或者缓存到中间系统上（代理服务器）。web 缓存把最近的请求放在本地磁盘中。当新请求到达时，如果新的请求和暂时存放的请求相同，就返回暂存的请求，不需要按照 URL 地址再次向远程服务器发送请求。

缓存过期时间：如果真实的文档已经改变，用户还从缓存中获取，那么无法获取最新的文档，就出错了。所以设置一个缓存判断，在请求报文中增加 If-modified-since 用来标识过期时间。如果请求的资源已经过期，那么再从远程服务器中获取资源（304 Not Modified）

例子：如果一个网页有两个小图片，以非流水线持续连接的方式，用时多少个 RTT？
解法：4个 RTT。首先一个TCP，然后请求 HTML，然后请求两个图片（非流水线）。持续连接，后面请求不需要重新 TCP 连接。

Last update: November 9, 2024