[Linux#62][TCP] 首位长度:封装与分用 | 序号:可靠性原理 | 滑动窗口:流量控制

news/2024/10/9 7:24:32 标签: tcp/ip, 网络协议, 网络, 后端, 笔记

目录

一. 认识TCP协议的报头

1.TCP头部格式

2. TCP协议的特点

二. TCP如何封装与分用

TCP 报文封装与解包

如何封装解包,如何分用

分离有效载荷

隐含问题:TCP 与 UDP 报头的区别

封装和解包的逆向过程

如何分用 TCP 报文

如何通过端口号找到绑定的进程?

数据交付给进程的过程

总结

三. TCP 的可靠性

学习 TCP 可靠性 (确认应答) && 提高传送效率

1. 网络传输中的不可靠问题

2. 网络传输中的不可靠性场景

3. TCP 可靠性的保证机制

4. TCP 收发消息的工作模式

5. 捎带应答机制

6. 批量确认的工作模式

四. 理解TCP的报头

1. 4位首位长度

2. 序号和确认序号:TCP 全双工通信与确认应答机制

2.1. TCP 真实工作模式

2.2. 问题分析

2.3. TCP 报文序号机制

2.4. 确认应答的机制

2.5. 丢包场景下的应答机制

2.6. 两组序号的必要性

2.7. 数据到达顺序与序号

3. 窗口大小:TCP缓冲区与流量控制

缓冲区的作用

数据传输过程

流量控制的必要性

流量控制机制

全双工通信

交换接收能力


TCP报头细节很多,我们打算这样开始

  1. 认识TCP协议的报头 — 字段
  2. 如何理解TCP的报头
  3. 如何封装解包,如何分用
  4. 学习TCP可靠性(确认应答) && 提高传送效率

一. 认识TCP协议的报头

1.TCP头部格式

TCP全称“传输控制协议”(Transmission Control Protocol),它对数据传输进行了详细的控制。TCP头部包含多个字段,每个字段都有特定的功能,以确保数据能够可靠地从一个端点传输到另一个端点。

理解TCP的报头:

Linux内核是C语言写的,在UDP说过报头是协议的表现,而协议本质就是结构体数据。所有tcp报头就是一个结构化或位段。

struct tcp_hdr这是一个类型,可以定义出一个对象。
把应用层的数据拷贝到缓冲区里,然后把报头拷贝到前面,不就是添加报头吗~

TCP协议报文也有自己的报头+有效载荷,这个有效载荷是应用层的报文,当然包含应用层报头和有效载荷。

  • 源/目的端口号: 表示数据是从哪个远端进程来, 到服务器哪个进程去
  • 序列号:用于解决网络包乱序问题,每次发送数据时累加数据字节数。
  • 确认应答号:指下一次期望收到的序列号,帮助解决丢包问题。
  • 4位TCP报头长度:表示该TCP头部有多少个32位比特,最大长度为60字节。

6位标志位

  1. SYN: 希望建立连接。
  2. ACK: 确认应答字段有效。
  3. FIN: 断开连接。
  4. PSH: 提示接收端应用程序立刻读取数据。
  5. RST: 要求重新建立连接。
  6. URG: 表示紧急指针字段有效。
  • 16位窗口大小:表明接收缓冲区还能容纳多少数据。
  • 16位校验和:验证整个TCP段的完整性。
  • 16位紧急指针标识紧急数据的位置。
  • 40字节头部选项:提供额外的信息或功能。

2. TCP协议的特点

  • 面向连接:TCP必须先建立连接才能进行数据传输。
  • 可靠:无论网络状况如何变化,TCP都能保证数据的正确传递。
  • 字节流:消息无边界,可以传输任意大小的数据,并且保持顺序。

二. TCP如何封装与分用

  • 4位首部长度表示TCP头部的总长度。
  • 如何封装:将应用层的数据加上TCP头部后交付给IP层。
  • 如何分用:根据头部长度计算出有效载荷的位置并提取数据。

TCP 报文封装与解包

  • 报文宽度:0-31 bit 是这个报文的宽度。每行4个字节,总共5行,因此标准 TCP 报文的长度是20字节,选项部分暂不考虑。
  • TCP 报文标准长度:标准 TCP 报文长度是20字节。

如何封装解包,如何分用

作为接收方,如何保证把一个 TCP 报文全部读完呢?其实很简单,具体步骤如下:

  1. 读取 TCP 标准报头
    • TCP 协议有标准长度:20字节。因此,先读取前 20 字节。
    • 这 20 字节转换为结构化数据后,立刻提取报头中的 4 位首部长度字段。
  1. 计算 TCP 报头总长度
    • 4 位首部长度字段表示的 TCP 报头总长度。其值范围为 0000-1111,即 [0,15]。
    • 4 位首部长度字段单位为 4 字节,因此 TCP 报头总长度 = 4 位首部长度 * 4 字节。报头长度范围为 [0,60] 字节。由于标准报头长度是 20 字节,因此最终 TCP 报头长度范围为 [20,60] 字节。
  1. 确定报头长度的计算
    • 若报头长度是 20 字节,则 4 位首部长度应填写为:x * 4 = 20,因此 x = 5,即 0101。
  1. 计算选项长度
    • 如果 TCP 报头长度为 x * 4,则减去 20 字节的标准长度后,剩下的即是选项的长度字节数。
    • 若无选项,则 x * 4 - 20 = 0;若有选项,则继续读取选项部分长度。

分离有效载荷

一旦读取完 TCP 报头,剩下的数据即为有效载荷,将其放入 TCP 接收缓冲区供上层继续读取。

隐含问题:TCP 与 UDP 报头的区别

  • UDP 报头:包含了 UDP 报文的长度,因此很容易确定 UDP 有效载荷的长度。
  • TCP 报头:仅包含 TCP 报头长度,但并未明确有效载荷长度。这是因为 TCP 是面向字节流的协议。

封装和解包的逆向过程

解包完成后,封装的过程也可以反向推导出来。只要能解包,就可以逆向封装报文。

如何分用 TCP 报文

在 TCP 报头中有 目的端口号,通过该端口号可以定位应用层的进程,将数据交付给相应进程。

如何通过端口号找到绑定的进程?

当接收到一个报文,如何找到绑定了特定端口的进程呢?以下是过程解析:

  1. 网络协议>网络协议栈与文件的关系
    • 虽然 PCB(协议控制块)通过双链表进行组织和管理,但为了快速定位进程,系统将每个 PCB 添加到一个数据结构中——哈希表
    • 系统中,bind 绑定一个端口时,会在 OS 中以端口号作为 key 维护一张哈希表。
  1. 通过哈希表定位进程
    • 当收到一个目的端口号 8080 的报头时,OS 会使用端口号查找哈希表,迅速找到与该端口绑定的进程 PCB。

数据交付给进程的过程

  1. 找到进程后如何交付数据?
    • 每个进程的 PCB 都维护有一个文件描述符表。文件描述符表的 0、1、2 是默认占用的,假设进程打开的文件描述符是 3,此时 socket 对应的就是 3。
  1. Linux 文件系统与网络协议>网络协议栈的关系
    • 在 Linux 下,一切皆文件。OS 为了维护文件,创建了一个 struct file 结构,内含许多读写方法的函数指针。
    • Linux 下文件的读写方法通过函数指针实现,对应文件的读写方法实际是传输层的读写方法。
    • 文件还有自己的缓冲区,用于存放数据。
  1. 读写过程
    • 当传输层收到 TCP 报文后,会将报头和有效载荷分离。有效载荷被放入文件的缓冲区中,上层应用通过文件描述符读取缓冲区,即可获取数据。

总结

数据报文经过 OS 各层处理,最终将有效载荷存放到文件的缓冲区中。上层应用可以通过文件的方式统一读取网络数据,实现了网络数据的封装与解包。

三. TCP 的可靠性

  • 32位序列号:对每个字节的数据编号,确保按序到达。
  • 32位确认应答号:响应历史数据,确保数据被正确接收。
  • 确认机制:通过序列号和确认应答号来保证数据的可靠性。

学习 TCP 可靠性 (确认应答) && 提高传送效率

1. 网络传输中的不可靠问题

❓ 谈 TCP 必谈可靠性,但在讨论可靠性之前,先考虑几个问题

  • 为什么网络传输时会存在不可靠的问题?
  • 不可靠问题常见的场景有哪些?
  • TCP 的可靠性如何保证?

以前我们学过冯诺依曼体系结构,里面包括 CPU、内存、外设(如显示器、键盘、鼠标、磁盘等),这些设备都是独立的。但我们可以将键盘的数据放入内存,也可以将内存中的数据传送到 CPU,这说明各个硬件并非孤立的,它们之间是有联系的。这些设备通过计算机中的“线”连接。

  • 内存和外设之间通信:通过 I/O 总线
  • 内存和 CPU 之间通信:通过 系统总线

内存和外设之间的通信也有自己的协议。因为有协议,所以可以控制外设。而这类协议的开发者通常属于“嵌入式”领域。

虽然内存和外设之间有通信协议,但我们并未讨论它们之间的可靠性问题。原因在于它们之间的距离很近,不存在网络传输中的可靠性问题。

2. 网络传输中的不可靠性场景

为什么网络传输时会存在不可靠的问题?

  • 原因:传输距离变长了

常见的不可靠场景有哪些?

  • 丢包
  • 乱序
  • 重复
  • 校验错误
3. TCP 可靠性的保证机制

如何理解 TCP 的可靠性?
假设两个人 A 和 B 之间相隔 500 米,A 问 B:“你吃饭了吗?” A 不能确定 B 听到了,除非 A 收到 B 的应答。所以,只有在收到应答的情况下,A 才能确认 B 听到了这句话。

但当 B 给 A 回复“我吃了”时,B 也无法确定 A 是否收到了这条信息。同样,只有当 A 回应后,B 才能确定 A 收到了“我吃了”这条信息。

这个例子说明了以下两点:

  1. 只有收到了应答,才能100%确认对方收到了之前的信息
    —— 确认应答后,消息才算可靠
  2. 通信中总会存在最新消息没有得到应答的情况
    —— 最新消息一般无法保证可靠性

因此,传输距离变长后,不可能存在绝对可靠性,只能保证相对可靠性。只要收到应答,就能保证该报文的可靠性。这就是 TCP 可靠性的基础:确认应答机制

4. TCP 收发消息的工作模式

在学习 TCP 时,需要理解两种工作模式:

  • 理论上的便捷理解方式
  • 实际工作中的 TCP 工作模式

实际通信过程

  1. Client 发起请求,Server 必须给确认
    由于应答的存在,Client 可以确认 Server 100% 收到了请求,因此可以保证 Client->Server 的可靠性。
  2. Server 回应 Client,Client 也必须给确认
    同理,这也保证了 Server->Client 的可靠性。

因此,通过确认应答机制,双方的数据传输都能保证可靠性。这些请求和应答是通过封装成 TCP 报文进行发送的。在实际通信中,除了正常的数据段,通信时也包含确认数据段。

5. 捎带应答机制

在实际工作模式中,确认应答可以与对请求的响应一起打包发送。以 A 和 B 的例子为例,A 问 B “你吃饭了吗?” B 本来应先确认收到消息,再回复“我吃了”。但 B 可以直接回复“我吃了”,这一条消息既是对 A 的确认应答,也是 B 给 A 的新消息。这就是所谓的 捎带应答

6. 批量确认的工作模式

另一种工作模式是 批量确认。Client 可以一次性给 Server 发出多个请求,Server 则可以批量确认这些请求,而非逐条应答。这种模式下,请求和应答是并发的。

不管是串行确认还是批量确认,原则上,无论是 C->S 还是 S->C,每个正常的数据段都需要应答来保证可靠性。但最新的一条消息是没有的

明确了上面的理论知识,可以帮助接下来我们谈tcp报头里序号和确认序号


四. 理解TCP的报头

16位校验和+选项我们不考虑,接下来学习tcp报头剩余字段以及背后的知识。

1. 4位首位长度

序号和确认序号等会谈,先谈4位首位长度

上面其实已经提到了,概述如下:

  • 4位TCP报头长度:表示该TCP头部有多少个32位bit(有多少个4字节),所以TCP头部最大长度是15 * 4 = 60

2. 序号和确认序号:TCP 全双工通信与确认应答机制

今天,客户端 (c) 可能向服务器 (s) 发送信息,也可能是服务器向客户端发送信息。由于双方都使用 TCP 协议,所以 TCP 的双方地位是对等的。要了解 TCP,只需要搞清楚一个方向的通信过程,反过来,另一个方向的通信也是一样的。

2.1. TCP 真实工作模式
  • Client 可能一次给 Server 发送多个请求报文,而 Server 也可以一次给 Client 发送多个确认应答。
2.2. 问题分析
  1. 数据的顺序问题
    如果客户端一次给服务器发送多个请求,数据到达对方的顺序是否和发送顺序一样?
    答案是不一定!数据在网络传输中可能乱序到达。
  2. 确认与请求的对应关系
    当 Server 连续收到多个请求后,要对请求进行确认。那么,Client 如何知道这些确认是对应哪个请求的呢?
    假设客户端发了4个请求,服务器只回了3个确认,那客户端必须知道自己发了4个请求,且只收到了3个确认,这样才能判断哪个报文丢失了。
2.3. TCP 报文序号机制

为了保证每个请求和应答可以对应上,TCP 请求报文(数据段)需要有方式标识数据段本身,因此每个数据段都有自己的 32位序号

  • 每一个请求和确认应答都是一个 TCP 报文,有数据的包含有效载荷,没数据的只包含 TCP 报头。
  • 每个 TCP 报文都会填充一个序号,确保报文有序。
2.4. 确认应答的机制

Server 给 Client 的应答报文中,需要和请求报文一一对应。因此,应答报文的报头中会包含确认序号,这样 Client 可以知道应答是对哪个请求的。

  • 序号与确认序号的对应规则
    • 假设 Client 发送了序号为 1000 的报文,Server 的确认序号将是 1001。
    • 如果 Client 发送了序号为 2000 的报文,Server 的确认序号则为 2001。
    • 也就是说你发过来的报文序号是多少,确认序号就是发过来的序号 + 1

  • 确认序号的含义
    确认序号表示接收方已经收到了该序号之前的所有报文(连续且无遗漏),并告知对方下次发送从该确认序号开始。
2.5. 丢包场景下的应答机制

如果某个报文丢失了,比如:

  • Client 发送了序号为 2000 的报文丢失了,Server 只收到了序号为 1000 和 3000 的报文。
  • Server 对序号为 1000 的报文返回确认序号 1001,但由于 2000 丢失了,即使收到了 3000 号报文,确认序号依然是 1001,因为 2000 之前的报文不是连续的。
  • 为什么这样设计?
    这是为了支持 TCP 的滑动窗口机制,使得确认序号可以线性右移,从而保持可靠的数据传输。
2.6. 两组序号的必要性

TCP 报文为什么要有两组序号?

  • 请求和应答的序号不能共享吗?
    不能。因为 TCP 是全双工通信,双方可以同时发送和接收数据。
    • 当 Client 给 Server 发信息时,Client 使用自己的序号,Server 给出确认序号。
    • 同时,Server 也可能给 Client 发送信息,这时 Server 需要自己的序号,Client 也需要给出对应的确认序号。
      因此,TCP 报头必须有两组独立的序号:一组用于发送方的数据序号,另一组用于接收方的确认序号。
  • 捎带应答
    当发送应答时,可能同时捎带发送给对方的数据,因此需要同时包含序号和确认序号。这是 TCP 通信中的常见模式。
2.7. 数据到达顺序与序号

如果客户端一次给服务器发送多个请求,数据的到达顺序可能与发送顺序不同。但是,由于报文中携带了序号,可以通过序号对乱序报文进行排序,保证数据的完整性和可靠性。

3. 窗口大小:TCP缓冲区与流量控制

缓冲区的作用
  • 发送缓冲区:用于暂时保存应用层通过IO接口拷贝过来的数据,等待通过网络发送。
  • 接收缓冲区:用于暂时保存从网络接收到的数据,直到被应用层读取。
数据传输过程
  1. 客户端(Client)将数据从应用层拷贝到其发送缓冲区。
  2. 数据通过网络传输到服务器(Server)的接收缓冲区。
  3. 服务器同样将响应数据从其应用层拷贝到发送缓冲区,并通过网络发送回客户端的接收缓冲区。
流量控制的必要性
  • 地理位置远近:客户端与服务器可能相隔很远。
  • 发送速度不匹配
    • 如果客户端发送数据过快,而服务器来不及处理,会导致服务器接收缓冲区溢出,后续到达的数据包将被丢弃。
    • 反之,如果发送速度过慢,则会影响对方上层业务的正常处理速度。
  • 合适的速度:为了确保数据传输既不过快也不过慢,需要一种机制来调节发送速率。
流量控制机制
  • 反馈机制:发送方需要知道接收方的接收缓冲区剩余空间大小,以调整自己的发送速率。
  • 16位窗口大小:TCP头部中的16位窗口大小字段表示的是接收方当前接收缓冲区的剩余空间大小。
    • 发送方根据这个窗口大小调整其发送速率。
    • 这个字段填入的是接收方的接收缓冲区剩余空间大小,而不是发送方的。

全双工通信
  • 双向控制:在全双工通信中,双方都需要知道对方的接收缓冲区剩余空间大小。
    • 客户端和服务器都需要保证对方能够以适当的速度接收数据。
    • 因此,每个方向上的TCP报文都包含一个16位窗口大小字段,表示自己的接收缓冲区剩余空间大小。
交换接收能力
  • 双向流量控制:这套规则对客户端和服务器同样适用,实现了双方在两个方向上的流量控制。
  • 目的:确保双方都能以合适的速度进行数据交换,避免缓冲区溢出或处理速度跟不上。

通过这种方式,TCP协议不仅确保了数据的可靠传输,还有效地管理了网络带宽的使用,提高了整体的通信效率。

下篇文章讲继续讲解 6 个标记位,结合应用层和传输层的角度,解释三次握手四次挥手~


http://www.niftyadmin.cn/n/5695469.html

相关文章

wsl中配置cuda,pytorch,cudnn,vscode

参考链接 查看python版本 从 NVIDIA 的官网上下载 CUDA 的 pin 文件。这个文件确保 CUDA 仓库的优先级更高,防止与其他仓库发生冲突。 wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin将下载的 cuda-wsl-u…

App模拟心跳长连接的实现方法demo

摘要 背景:心跳通常是指客户端或服务器定期发送一个小型的、空的消息以保持连接的活动状态。它用于检测连接是否仍然有效,并防止连接由于长时间没有活动而被关闭。 技术原理:App定时发消息给服务器,服务器回消息表示连接依旧有效…

《大规模语言模型从理论到实践》第一轮学习--强化学习(RLHF)

一、强化学习的意义 RLHF(Reinforcement Learning from Human Feedback):强化学习(Reinforcement Learning)结合人类反馈(Human Feedback)来微调大语言模型。 大语言模型的训练步骤包括:预训…

HUAWEI_HCIA_实验指南_Lib1.4_配置通过Telnet登录系统

一、原理概述 Telnet(Telecommunication Network Protocol)起源于ARPANET,是最早的Internet应用之一。 Telnet 通常用在远程登录应用中,以便对本地或远端运行的网络设备进行配置、监控和维护。如网络中有多台设备需要配置和管理,用户无需为每一台设备…

ACM(Association for Computing Machinery)简介

ACM(Association for Computing Machinery)简介 ACM,全称为 Association for Computing Machinery,中文译作“计算机协会”,是全球历史最悠久、规模最大的计算机领域专业组织。成立于1947年,ACM致力于推动…

一个开源可本地部署的英文翻译服务----EnToZhAPI

EnToZhAPI项目简介 项目背景 提供本地化的英文翻译服务API。支持单句翻译请求或者批量翻译请求。支持建立查询词汇表。 项目架构 前端:使用原生js,使用MDB作为CSS框架。django模板引擎渲染可视化界面。 后端:使用waitress作为后端服务器…

GPT-2 的 Transformer Block 设计与基础 Transformer 的比较

随着深度学习在自然语言处理领域的迅猛发展,Transformer 架构逐渐成为了语言模型的主流结构。自从 Vaswani 等人提出的基础 Transformer 在《Attention is All You Need》论文中首次亮相以来,各种改进版本相继问世。GPT-2 是其中一个重要的里程碑&#x…

OCP迎来新版本,让OceanBase的运维管理更高效

近期,OceanBase的OCP发布了新版本,全面支持 OceanBase 内核 4.3.2 及更低版本。新版本针对基础运维、性能监控、运维配置、外部集成等多个方面实现了 20余项的优化及强化措施,增强产品的易用性和稳定性,从而帮助用户更加高效地管理…