TCP的可靠传输机制

TCP通过校验和、序列号、确认应答、重发控制、连接管理以及窗口控制等机制实现可靠性的传输。
先来看第一个可靠性传输的方法。

通过序列号和可靠性提供可靠性

TCP是面向字节的。TCP把应用层交下来的报文(可能要划分为许多较短的报文段)看成一个一个字节组成的数据流,并使每一个字节对应一个序号。在建立连接时,双方TCP要各自确定初始序列号。TCP每次发送的报文段的首部中的序列字段数值表示该报文段中首部后面的第一个数据字节的序号
TCP使用的是累计确认,即确认是对所有按序接收到的数据的确认。需要注意的是,接收方返回的确认号是已按序收到的数据的最高序号加1,也就是说,确认号表示接收方期望下次收到的数据中的第一个数据字节的序号
当发送端的数据到达接收主句时,接收端主机会返回一个已收到消息的通知。这个消息叫做确认应答(已指已经接收)。就相当于别人对你发了一条消息,你要回复一句,这样对方才知道你已经收到了消息。
请添加图片描述

TCP通过肯定的确认应答(ACK)实现可靠的数据传输。当发送端将数据发出之后会等待对端的确认应答。如果没有确认应答,说明数据已经成功到达对端。反之,则数据丢失的可能性很大。
如下图所示,在一定的时间内要是没有等到确认应答,发送端就可以认为数据已经丢失,并进行重发。由此,即使产生了丢包,仍然能够保证数据能够到达对端,实现可靠传输。
请添加图片描述

未收到确认应答并不意味着数据一定丢失。也可能是数据对方已经收到,只是返回的确认应答在途中丢失。这种情况也会导致发送端因没有收到确认应答,而认为数据没有到达目的地,从而进行重发。如图所示:
请添加图片描述

图示的情况是,由主机B返回的确认应答,因网络原因在传送带途中丢失,没有到达主机A。主机A会等待一段时间,若在特定的时间间隔内始终没有收到确认应答,主机A就会对此数据进行重发。此时,主机B将第二次发送已接收此数据的确认应答。由于主机B其实已经收到过1~1000的数据,当再有相同数据送达时它会放弃。

此外,也有可能因为一些其他原因导致确认应答延迟到达,在源主机重发数据以后才到达的情况也有。此时,源发送主机只要按照机制重发数据即可。但是对于目标主机来说,这简直是一种“灾难”。它会反复收到相同的数据。而为了对上层应用提供可靠的传输,必须得放弃重发的数据包而且要立即发回确认信息。为此,就必须引入一种机制,它能够识别是否已经接收数据,又能够判断是否需要接收。


上述这些确认应答处理、重发控制以及重复控制等功能都可以通过序列号实现。序列号是按顺序给发送数据的每一个字节都标上号码的编号。接收端查询接收数据TCP首部中的序列号和数据的长度,将自己下一步应该接收到序号作为确认应答返送回去。就这样,通过序列号和确认应答号,TCP可以实现可靠传输。例如,已经收到了1700号、8011000号和12011500号,而701800号及1001~1200号的数据还没有收到,那么这时发送的确认号应为701号。
请添加图片描述

TCP的数据长度并未写入TCP首部。实际通信中求得TCP包的长度的计算公式是:IP首部中的数据包长度 — IP首部长度TCP首部长度。

重复超时如何确定

重发超时是指在重复数据之前,等待确认应答到来的那个特定时间间隔。如果超过了这个时间仍未收到确认应答,发送端将数据进行数据重发。那么这个重发超时的具体时间长度又是如果确定的呢?
最理想的是,找到一个最小的时间,它能保证“确认应答一定能在这个时间内返回”。然而这个时间长短随着数据包途径的网络环境的不同而有所变化。例如在高速的LAN中时间较短,而在长距离的通信当中应该比LAN要长一些。即使是在同一个网络中,根据不同时段的网络拥堵程度时间的长短也会发送变化。
重发超时的计算既要考虑往返时间又要考虑偏差是有原因的,如下图所示,根据网络环境的不同往返时间可能会产生大幅度的摇摆,之所以发生这种情况是因为数据包的分段是经过不同线路到达的。TCP/IP的目的是即使在这种环境下也要进行控制,尽量不要浪费网络流量。
请添加图片描述

在BSD的Unix以及Windows系统中,超时都以0.5秒为单位进行控制,因此重发超时都是0.5秒的整数倍。不过,由于最初的数据还不知道往返时间,所以其重发超时一般设置为6秒左右。
数据被重发之后若还是收不到确认应答,则进行再次重发。此时,等待确认应答的时间会以2倍、4倍的指数函数延长。但是也不会无限重发。达到一定重发次数后,如果仍没有确认应答返回,就会判断网络或对端主机发生了异常,强制关闭连接。并且通知应用通信异常强行终止。

TCP以段位单位发送数据

在建立TCP连接的同时,也可以确定发送数据包的单位,我们可以称为“最大消息长度”(MSS:Maximum Segment Size)。最理想的情况是,最大消息长度正好是IP中不会被分片处理的最大数据长度。
TCP在传送大量数据时,是以MSS的大小将数据进行分割发送。进行重发时也是以MSS为单位。
MSS是在三次握手的时候,在两端主机之间被计算得出。两端的主机在发出建立连接的请求时,会在TCP首部中写入MSS选项,告诉对方自己的接口能够适应MSS的大小。然后会在二者之间选择一个较小的值使用。

为附加MSS选项,TCP首部将不再是20字节,而是4字节的整数倍,如图所示的+4。

请添加图片描述

1和2通过建立连接的SYN包相互通知对方网络接口的MSS值。3在两者之间选一个较小的作为MSS的值,发送数据。

滑动窗口

利用窗口控制提高速度

TCP以1个段为单位,每发一个段进行一次确认应答的处理。这样的传输方式有一个缺点,那就是,包的往返时间越长通信性能就越低,网络的吞吐量会越差。
请添加图片描述

为了解决这个问题,TCP引入了窗口这个概念。即使在往返时间较长的情况下,它也能控制网络性能的下降。如图所示,确认应答不再是以每个分段,而是以更大的单位进行确认时,转发时间将会被大幅度的缩短。也就是说,发送端主机,在发送了一个段以后不必要一直等待确认应答,而是继续发送。
请添加图片描述

根据窗口为4000字节时返回的确认应答,下一步就发送比这个值还要大4000个序列号为止的数据。这跟前面每个段接收确认应答以后再发送另一个新段的情况相比,即使往返时间变长也不会影响网络的吞吐量。


窗口大小就是指无需等待确认应答而可以继续发送数据的最大值。上图中,窗口大小为4个段,每个段是1000字节。
这个机制实现了使用大量的缓冲区,通过对多个段同时进行确认应答的功能。
如下图所示,发送数据中高亮圈起来的部分正是刚才提到的窗口。在这个窗口内的数据即便没有收到确认应答也可以发送出去。此外,从该窗口中能看到的数据因其某种数据已在传输中丢失,所以发送端才能收到确认应答,这种情况也需要重发。为此,发送端主机在等到确认应答返回前,必须在缓冲区中保留这部分数据。

  • 滑动窗口的方式
    请添加图片描述

在1的状态下,如果收到一个请求序列号为2001的确认应答,那么2001之前的数据就没有必须必须进行重发,这部分的数据可以被过滤掉,滑动窗口成为3的样子。

窗口控制与重发控制

在使用窗口控制中,要是出现段丢失该怎么办?
首先,我们先考虑确认应答未能返回的情况。在这种情况下,数据已经到达对端,是不需要再进行重发的。然而,在没有使用窗口控制的时候,没有收到确认应答的数据都会被重发。而使用了窗口控制,某些确认应答即便丢失也无需重发。
请添加图片描述

窗口在一定程序上较大时,即使有少部分的确认应答丢失也不会进行数据重发。可以通过下一个确认应答进行确认。

其次,我们来分析一下某个报文段丢失的情况。如下图所示,接收主机如果收到一个自己应该接收到序号以外的数据时,会针对当前为止收到数据返回确认应答。
如图所示,当某一报文丢失后,发送端会一直收到序号为1001的确认应答,这个确认应答好像在提醒发送端“我想接收到是1001开始的数据”。因此,在窗口比较大,又出现报文段丢失的情况下,同一个序号的确认应答将会被重发不断的返回。而发送端主机如果连续3次收到同一个确认应答,就会将其所对应的数据进行重发。这种机制比之前的超时管理更加高效,因此也被称为高速重发机制。
请添加图片描述

接收端在没有收到自己所期望序号的数据时,会对之前收到的数据进行确认应答。发送端则一旦收到某个确认应答后,又连续3次收到同样的确认应答,则认为数据段已经丢失,需要进行重发。

流量控制

发送端根据自己的实际情况发送数据。但是,接收端可能收到的是一个毫无关系的数据包又可能会在处理其它问题上花费一些时间。因此在为这个数据包做其他处理时会耗费一些时间,甚至在高负荷的情况下无法接收任何数据。如此一来,如果接收端本应该接收端数据丢弃的话,就又会触发重发机制,从而导致网络流量的无端浪费。
为了防止这种现象的发生,TCP提供一种机制可以让发送端根据接收端的实际接收能力控制发送端数据量。这就是所谓的流量控制。它的具体操作是,接收端主机向发送端主机通知自己可以接收数据的大小,于是发送端会发送不超过这个限度的数据。该大小限度就被称为窗口大小,窗口大小的值由接收端主机决定的。
TCP首部中,专门有一个字段用来通知窗口大小。接收主机将自己可以接收端缓冲区大小放入这个字段中通知发送端。这个字段的值越大,说明网络的吞吐量越高。不过,接收端的这个缓冲区一旦面临数据溢出时,窗口大小的值也会随之被设置为一个更小的值通知给发送端,从而控制数据发送量。也就是说,发送端主机会根据接收端主机的指示。对发送数据的量进行控制。这也就形成了一个完整的TCP流控制。
图为根据窗口大小控制流量过程的示例。
请添加图片描述

如图所示,当接收端收到从3001号开始的数据段后其缓冲区即满,不得不暂时停止接收数据。之后,在收到发送窗口更新通知后通信才得以继续进行。如果这个窗口的更新通知再传输途中丢失,可能还会导致无法继续通信。为避免此类问题的发生,发送端主机会时不时的发送一个叫做窗口探测的数据段,此数据段仅含一个字节以获取最新的窗口大小信息。

拥塞控制

一般来说,计算机网络处在一个共享的环境。因此也有可能会因为其他主机之间的通信使得网络拥堵。在网络出现拥堵时,如果突然发送一个较大量的数据,极有可能会导致整个网络的瘫痪。
TCP为了防止这种问题的出现,在通信一开始时就会通过一个叫做慢启动的算法得出的数值,对发送数据量进行控制。
请添加图片描述

首先,为了在发送端调节所要发送数据的量,定义了一个叫做“拥塞窗口”的概念。于是在慢启动的时候,将这个拥塞窗口的大小设置为1个数据段发送数据,之后每收到一次确认应答(ACK),拥塞窗口的值就加1.在发送数据包时,将拥塞窗口的大小与接收端主机通知的窗口大小做比较,然后按照它们当中较小的那个值,发送比其还要小的数据量。
如果采用超时机制,那么拥塞窗口的初始值可以设置为1以后再进行慢启动修正。有了上述这些机制,就可以有效的减少通信开始时联系发包导致的网络拥堵,还可以避免网络拥堵的发生。
不过,随着包的每次往返,拥塞窗口也会以1、2、4等指数函数的增长,拥堵状况激增甚至会导致网络拥塞的发生。为了防止这些,引入了慢启动阈值的概念。只要拥塞窗口的值超出这个阈值,在每收到一次确认应答时,只允许下面这种比例放大拥塞窗口。
1个数据段的字节数拥塞窗口(字节)×1个数据段字节数 \frac{1个数据段的字节数}{拥塞窗口(字节)}×{1个数据段字节数}拥塞窗口(字节)1个数据段的字节数×1个数据段字节数
请添加图片描述

拥塞窗口越大,确认应答的数目也会增加。不过随着每收到一个确认应答,其涨幅也会逐渐减少,甚至小过比一个数据段还要小的字节数。因此,拥塞窗口的大小会呈直线上升的趋势。
TCP的通信开始时,并没有设置相应的慢启动阈值。而是在超时重发时,才会设置为当时拥塞窗口的一半大小。
由重发确认应答而触发的高速重发与超时重发机制的处理多少有些不同。因为前者要求至少三次的确认应答数据段到达对方主机后才会触发,相比后者网络的拥堵要轻一些。
而由重复确认应答进行高速重发控制时,慢启动阈值的大小被设置为当时窗口大小的一半。然后将窗口的大小设置为慢启动阈值+3个数据段的大小。
有了这样一种控制,TCP的拥塞窗口如上图所示发送变化。由于窗口的大小会直接影响数据被转发时的吞吐量,所以一般情况下,窗口越大,越会形成高吞吐量的通信。
当TCP通信开始以后,网络吞吐量会逐渐上升,但是随着网络拥堵的发生吞吐量也会急速下降。于是会再次进入吞吐量慢慢上升的过程。因此所谓TCP的吞吐量的特点就好像在逐步占领网络宽度的感觉。

延迟确认应答

接收数据的主机如果每次都立刻回复确认应答的话,可能会返回一个较小的窗口。那是因为刚接收完数据,缓冲区已满。
当某个接收端收到这个小窗口的通知以后,会以它为上限发送数据,从而又降低了网络的利用率。为此,引入了一个方法,那就是收到数据以后并不立即返回确认应答,而是延迟一段时间的机制。
事实上,大可不必为每一个数据段进行一次确认应答。TCP采用滑动窗口的控制机制,因此通常确认应答少一些也无妨、TCP文件传输中,绝大多数是每两个数据段返回一次确认应答。
请添加图片描述

捎带应答

捎带应答是指TCP的确认应答和回执数据可以通过一个包发送。通过这种机制,可以使收发的数据量减少。
另外,接收数据以后如果立刻返回确认应答,就无法实现捎带应答。而是将所接收到数据传给应用处理生成返回数据以后再进行发送请求为止,必须一直等待确认应答的发送。也就是说,如果没有启用延迟确认应答就无法实现捎带应答。延迟确认应答是能够提高网络利用率从而降低计算机处理负荷的一种较优的处理机制。
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/88150.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/88150.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

没有DBA的敏捷开发管理

前言一家人除了我都去旅游了,我这项请假,请不动啊。既然在家了,闲着也是闲着,就复盘下最近的工作,今天就复盘表结构管理吧,随系统启动的,不是flyway,而是另一个liquibase&#xff0c…

go-carbon v2.6.10发布,轻量级、语义化、对开发者友好的 golang 时间处理库

carbon 是一个轻量级、语义化、对开发者友好的 Golang 时间处理库,提供了对时间穿越、时间差值、时间极值、时间判断、星座、星座、农历、儒略日 / 简化儒略日、波斯历 / 伊朗历的支持。 carbon 目前已捐赠给 dromara 开源组织,已被 awesome-go 收录&am…

【AI News | 20250708】每日AI进展

AI Repos 1、claude-code-templates Claude Code Templates是一款全面的命令行工具,旨在为不同编程语言和框架(如JavaScript/TypeScript、Python等,Go和Rust即将推出)提供优化的Claude Code配置。它通过交互式设置、自动化钩子&a…

Nginx源码安装+静态站点部署指南(CentOS 7)

安装包:可自行前往我的飞书下载 Docs 也可以进入 nginx 官网,下载自己所需适应版本 nginx 开始安装nginx 1. 创建准备目录 cd /opt mkdir soft module # 创建软件包和源码解压目录 2. 安装依赖环境 yum -y install make zlib zlib-devel gcc-c l…

交换机的核心原理和作用

一、交换机的核心原理交换机是一种用于连接多台设备的网络硬件,其核心原理基于二层网络(数据链路层)的 MAC 地址寻址1. MAC 地址学习与存储当交换机接收到数据帧时,会读取帧中的源 MAC 地址,并将该地址与对应的端口号记…

【工具变量】上市公司企业金融强监管数据、资管新规数据(2001-2024年)

数据简介:参考顶刊《经济研究》李青原(2022)老师的做法,Post 为时间虚拟变量,根据资管新规实施的时间,当观测期为2018 年上半年及之后时,Post 取值1,否则取值0。PreFin 为资管新规实…

CSS Grid与Flexbox布局实战对比

概述 CSS布局技术在过去几年经历了重大变革,从传统的基于浮动和定位的方法,到现在强大的Flexbox和Grid布局系统。这两种现代布局方法极大地简化了复杂界面的开发过程,但它们各自适用于不同的场景。本文将对Flexbox和Grid进行深入比较&#x…

[Pytest][Part 4]多种测试运行方式

实现需求2:有两种运行测试的方式:通过config配置文件运行,测试只需要修改config配置文件cmdline 运行这里是新建一个config类来存储所有的测试配置,以后配置有修改的话也只需要修改这个类。根据目前的测试需求,config中…

平衡二叉树的删除操作

对于平衡二叉树的操作应对与考试只需要模拟出过程即可,且他的过程和插入的平衡方法一样,不一样的只是对于平衡因子的计算上。接下来我将给出方法①删除结点(方法同“二叉排序树”) ②一路向北找到最小不平衡子树,找不到…

Spark 4.0的 VariantType 类型优点以及使用分析

背景 本文基于Spark 4.0。 总结 对于半结构化的数据来说,我们一般会有两种方式进行存储: 第一种是存储为JSON String,这种可以保证Schema free,但是在使用的时候得解析为JSON,从而进行运算操作。 第二种是存储为Struct类型,这种虽…

17-C#封装,继承,多态与重载

C#封装继承多态 1. 2. 3.多态 public abstract class animal//抽象类 {public abstract void eat();//抽象方法 } public class cat : animal//继承 {public override void eat()//重写{messagebox.show("cat eat");} } public class dog: animal//继承 {public over…

恒创科技:香港站群服务器做seo站群优化效果如何

香港站群服务器做 SEO 站群优化效果如何?在当前搜索引擎优化竞争日益激烈的环境下,越来越多的企业开始关注站群策略这一高效的 SEO 手段。作为亚洲重要的网络枢纽,香港站群服务器因其独特优势,正成为实施 SEO 站群优化的热门选择。本文将客观…

Linux-进程管理

Linux-进程管理Linux 进程管理1. 进程的含义2. 进程状态3. 进程工作模式4. 守护进程5. 进程查看命令5.1 ps 命令5.2 top 命令5.3 pstree 命令6. 终止进程的 kill 命令7. 前后台运行8. 暂停进程9. 进程文件系统 /proc10. 定时任务管理10.1 at 命令10.2 batch 命令10.3 cron 与 c…

OpenCV图像增强秘籍:高通滤波与特效艺术

> 在数字图像处理领域,边缘是图像最富信息的区域。掌握高通滤波技术,你就能让图像中的隐藏细节"跃然纸上",甚至创造惊艳的艺术效果。 ## 一、图像增强与高通滤波基础 ### 1.1 图像增强的核心目标 图像增强不是简单的美化,而是通过技术手段**突出重要特征*…

347. 前K个高频元素

题目: 给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。 示例: 输入: nums [1,1,1,2,2,3], k 2 输出: [1,2] 解题思路: 要返回出现频率前k高的元素,那么我们首…

C++面试冲刺笔记1:虚函数的基本工作原理

C面试冲刺笔记1:虚函数的基本工作原理 前言 ​ 笔者最近开始投简历,出于应对之后快速的面试流程需求,这里准备的是将常见的C八股文进行总结,从而方便自己进行学习,检查和评估。 什么是虚函数 ​ 虚函数,本质…

Spring Boot 事务失效问题详解:原因、场景与解决方案

在 Spring Boot 开发中,事务管理是保证数据一致性和完整性的核心机制。然而,许多开发者在使用 Transactional 注解时,可能会遇到事务失效的问题,导致数据异常或业务逻辑错误。本文将深入分析 Spring Boot 中事务失效的常见原因&am…

Python-文件操作-StringIO和BytesIO-路径操作-shutil模块-csv,ini序列化和反序列化-argparse使用-学习笔记

序 欠4年前的一份学习笔记,献给今后的自己。 文件操作 冯诺依曼体系架构CPU由运算器和控制器组成 运算器,完成各种算数运算、逻辑运算、数据传输等数据加工处理 。 控制器,控制程序的执行 存储器,用于记忆程序和数据,例…

LLM的表征做减法的是什么,自然语言是一个矩阵,怎么进行减法的

LLM的表征做减法的是什么,自然语言是一个矩阵,怎么进行减法的 有个假设:就是最后一个词语融合了前面词语的信息 减法操作主要用于提取模型内部表征中的"诚实性"概念向量。具体来说,这是通过对比诚实和不诚实场景下的模型隐藏状态实现的。 import torch from t…

Java创建型模式---单例模式

单例模式基础概念单例模式是一种创建型设计模式,其核心思想是确保一个类仅有一个实例,并提供一个全局访问点来获取这个实例。在 Java 中实现单例模式主要有以下关键点:私有构造函数 - 防止外部通过new关键字创建实例静态实例变量 - 类内部持有…