【Net】TCP粘包与半包

文章目录

  • TCP粘包与半包
    • 1 背景
    • 2 粘包(packet stick)
    • 3 半包(packet split)
    • 4 为什么会出现粘包/半包?
    • 5 如何解决?
    • 6 示例
    • 7 总结

TCP粘包与半包

在网络编程中,粘包半包问题是常见的 TCP 协议特有问题,尤其在基于流的传输协议中(如 TCP),它们常导致接收端无法正确还原发送端原本的一条条消息。


1 背景

TCP 是“字节流”协议,不保留消息边界,它只是一个字节流协议,只保证字节的顺序和完整性,但不关心应用层每条消息的边界。这就导致了“粘包”和“半包”的出现。


2 粘包(packet stick)

定义多条数据包被粘在一起,接收端一次接收到了多条消息数据。

举例:

客户端连续发送两条消息:

[hello][world]

由于 TCP 是流式协议,可能在接收端变成:

[helloworld]

此时接收端无法确定 “hello” 和 “world” 的边界。


3 半包(packet split)

定义一条完整的数据被拆成了几部分接收,接收端一次只能收到其中的一部分。

举例:

客户端发送一条 10 字节的消息:

[helloworld]

可能接收端第一次 recv 只收到:

[hello]

下一次再收到:

[world]

也就是说,一条消息被拆成了“半包”。


4 为什么会出现粘包/半包?

  • TCP 特性导致:
    1. TCP 是字节流,不维护消息边界;
    2. Nagle 算法 会将小包合并发送(导致粘包);
    3. 接收端 buffer 缓冲区大小不确定,一次 read/recv 可能读不到完整数据(导致半包);
    4. 操作系统的发送/接收策略 也会影响包的合并与拆分。

5 如何解决?

  • 通用思路:在应用层实现消息边界的识别机制

    以下几种常见方案可以避免粘包/半包问题:

    1. 定长协议

      • 每条消息固定长度(例如每条消息都是 128 字节)。
      • 优点:实现简单;
      • 缺点:浪费带宽,不适用于变长消息。
    2. 添加分隔符

      • 每条消息结尾加特定分隔符(如 "\r\n")。
      • 接收端通过查找分隔符来拆分消息;
      • 缺点:消息内容中不能出现分隔符。
    3. 长度前缀协议(最常用)

      • 每条消息前加一个固定长度的字段表示消息体长度(如 4 字节整数):

        [4字节长度][消息体]
        

        示例:

        [00000005][hello]
        [00000005][world]
        
        • 接收端读取前 4 字节判断消息长度,再读取对应长度的消息体,精确拆包。

6 示例

C++ 实现的长度前缀协议收发逻辑示例,适用于基于 TCP 的客户端或服务器程序,用于解决粘包/半包问题。


  • 协议格式
[4字节消息长度][消息体内容]
- 消息长度为 uint32_t(网络字节序)

  • 核心发送/接收逻辑

发送端逻辑(附加长度前缀)

#include <arpa/inet.h> // htonl
#include <string>
#include <unistd.h>    // writebool sendMessage(int sockfd, const std::string& message) {uint32_t len = htonl(message.size()); // 转为网络字节序std::string packet;packet.append(reinterpret_cast<const char*>(&len), sizeof(len)); // 4字节长度packet.append(message); // 实际消息体size_t totalSent = 0;while (totalSent < packet.size()) {ssize_t sent = write(sockfd, packet.data() + totalSent, packet.size() - totalSent);if (sent <= 0) return false;totalSent += sent;}return true;
}

接收端逻辑(支持粘包/半包)

#include <arpa/inet.h> // ntohl
#include <unistd.h>    // read
#include <vector>
#include <string>bool recvExact(int sockfd, void* buffer, size_t length) {size_t total = 0;while (total < length) {ssize_t n = read(sockfd, (char*)buffer + total, length - total);if (n <= 0) return false; // 连接关闭或出错total += n;}return true;
}bool recvMessage(int sockfd, std::string& outMessage) {uint32_t len_net;if (!recvExact(sockfd, &len_net, sizeof(len_net))) return false;uint32_t len = ntohl(len_net);if (len > 10 * 1024 * 1024) return false; // 限制最大消息长度,防止攻击std::vector<char> buffer(len);if (!recvExact(sockfd, buffer.data(), len)) return false;outMessage.assign(buffer.begin(), buffer.end());return true;
}

客户端完整用法

std::string msg = "hello world";
sendMessage(sockfd, msg);std::string received;
if (recvMessage(sockfd, received)) {std::cout << "Received: " << received << std::endl;
}

说明与扩展建议

项目说明
字节序使用 htonl/ntohl 保证跨平台兼容
粘包支持多条消息合并也能正确拆分
半包支持recvExact 保证完整读取
安全性应添加最大长度检查,防止恶意攻击
异步扩展可结合 epoll 实现非阻塞版本

7 总结

问题表现原因解决方式
--------
粘包多条消息合并TCP 合并包定长、分隔符、长度前缀
半包一条消息被拆开TCP 拆包接收端维护 buffer,支持多次接收拼接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/82189.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode 3566. Partition Array into Two Equal Product Subsets

Leetcode 3566. Partition Array into Two Equal Product Subsets 1. 解题思路2. 代码实现 题目链接&#xff1a;3566. Partition Array into Two Equal Product Subsets 1. 解题思路 这一题我的实现还是比较暴力的&#xff0c;首先显而易见的&#xff0c;若要满足题目要求&…

QT中更新或添加组件时出现“”qt操作至少需要一个处于启用状态的有效资料档案库“解决方法”

在MaintenanceTool.exe中点击下一步 第一个&#xff1a; 第二个&#xff1a; 第三个&#xff1a; 以上任意一个放入资料库中

52. N-Queens II

题目描述 52. N-Queens II 回溯法 这道题与第51题是一样的。51. N-Queens-CSDN博客 class Solution {int columns; //从低位到高位起算&#xff0c;第i位为0表示棋盘第i列可以放置皇后&#xff0c;第i位为1表示棋盘第i列不能放置皇后//边长为n的棋盘分别有2n-1条正斜线和反…

解锁AI智能Agent的“风格基因”

从“黑箱”到“智能Agent”:LangChain的架构哲学革新 在LangChain出现之前,开发者直接调用LLM API的方式,充满了“黑箱”操作的挑战: 紧耦合的业务逻辑与模型调用: 所有的业务逻辑、API调用、记忆管理、错误处理等都可能混杂在同一个代码块中。这导致代码脆弱、难以测试,…

大数据运维过程中常见的一些操作

大数据运维是确保大数据系统稳定运行、高效处理数据的关键环节。以下是大数据运维过程中常见的一些操作和任务: 1. 集群部署与配置 基础设施搭建:部署服务器、网络设备、存储系统,配置虚拟化环境(如 Docker、Kubernetes)。分布式系统安装:安装 Hadoop、Spark、Hive、Kaf…

STM32中,如何理解看门狗

在STM32微控制器中&#xff0c;看门狗&#xff08;Watchdog&#xff09;是一种硬件计时器&#xff0c;用于监控系统运行状态&#xff0c;防止软件死锁或跑飞。其核心机制是&#xff1a;系统需定期“喂狗”&#xff08;复位看门狗计数器&#xff09;&#xff0c;若未及时喂狗&am…

[AI算法] LLM中的gradient checkpoint机制

文章目录 什么是gradient checkpoint原理使用场景 注意事项 什么是gradient checkpoint gradient checkpoint是一种优化深度学习模型内存使用的技术&#xff0c;尤其在训练大型模型时非常有用。它通过牺牲计算时间为代价来减少显存占用。大多数情况下&#xff0c;transformers…

船舶二阶非线性响应方程的EKF与UKF参数辨识

船舶二阶非线性响应方程的EKF与UKF参数辨识 本文将详细阐述使用Python实现扩展卡尔曼滤波(EKF)和无迹卡尔曼滤波(UKF)对船舶二阶非线性响应方程进行参数辨识的过程。全文包含理论推导、算法实现、仿真验证及结果分析。—### 1. 船舶二阶非线性响应方程建模船舶运动可表示为&am…

【ARM AMBA APB 入门 1.1 -- APB 读写寄存器 RTL 实现】

请阅读【ARM AMBA 总线 文章专栏导读】 文章目录 APB 寄存器访问APB 读寄存器 RTL 代码实现APB 写寄存器 RTL 代码实现 APB 寄存器访问 APB 读寄存器 RTL 代码实现 APB 总线读寄存器操作代码实现&#xff1a; wire [31:0] SOC_PLL_CFG_REG; wire [31:0] SOC_PLL_LOCK_REG; wi…

C++修炼:位图和布隆过滤器

Hello大家好&#xff01;很高兴我们又见面啦&#xff01;给生活添点passion&#xff0c;开始今天的编程之路&#xff01; 我的博客&#xff1a;<但凡. 我的专栏&#xff1a;《编程之路》、《数据结构与算法之美》、《题海拾贝》、《C修炼之路》 1、引言 在计算机科学…

Java大厂后端技术栈故障排查实战:Spring Boot、Redis、Kafka、JVM典型问题与解决方案

Java大厂后端技术栈故障排查实战&#xff1a;Spring Boot、Redis、Kafka、JVM典型问题与解决方案 引言 在互联网大厂&#xff0c;Java后端系统往往承载着高并发、高可用和复杂业务需求。系统架构日益复杂&#xff0c;涵盖微服务、缓存、消息队列、数据库等多种组件&#xff0…

交叉编译tcpdump工具

1.导出交叉编译工具链 export PATH$PATH:/opt/rockchip/gcc-linaro-6.3.1-2017.05-x86_64_arm-linux-gnueabihf/bin 下载源码包libpcap-1.10.5&#xff0c;配置、并编译安装。 github仓库地址 ./configure --hostarm-linux CCarm-linux-gnueabihf-gcc --prefix$PWD/install …

Pytest Fixture 是什么?

Fixture 是什么&#xff1f; Fixture 是 Pytest 测试框架的核心功能之一&#xff0c;用于为测试函数提供所需的依赖资源或环境。它的核心目标是&#xff1a; ✅ 提供测试数据&#xff08;如模拟对象、数据库记录&#xff09; ✅ 初始化系统状态&#xff08;如配置、临时文件&a…

【深度剖析】流处理系统性能优化:解决维表JOIN、数据倾斜与数据膨胀问题

目录 前言:为什么你的流处理作业总是慢? 一、维表JOIN优化:从普通连接到高性能查询 1.1 时态表的双面性 1.2 Lookup Join 优化 1.3 多表JOIN优化策略 二、数据倾斜:单分区也会遇到的隐形杀手 2.1 单分区数据倾斜 2.2 热点键打散技术 2.3 时间窗口预聚合 三、数据…

Codeforces Round 1028 (Div. 2)(ABC)

A. Gellyfish and Tricolor Pansy 翻译&#xff1a; 水母和小花在玩一个叫 “决斗 ”的游戏。 水母有 a HP&#xff0c;花花有 b HP。 它们各有一个骑士。水母的骑士有 c HP&#xff0c;而花花的骑士有 d HP。 他们将进行一轮游戏&#xff0c;直到其中一方获胜。对于 k1、2、.…

数字创新智慧园区建设及运维方案

该文档是 “数字创新智慧园区” 建设及运维方案,指出传统产业园区存在管理粗放等问题,“数字创新园区” 通过大数据、AI、物联网、云计算等数字化技术,旨在提升园区产业服务、运营管理水平,增强竞争力,实现绿色节能、高效管理等目标。建设内容包括智能设施、核心支撑平台、…

缓存一致性协议的影响

在操作系统中&#xff0c;线程切换相比进程切换更轻量级的关键原因之一是 缓存&#xff08;Cache&#xff09;的有效性&#xff0c;尤其是对 CPU 缓存&#xff08;如 L1/L2/L3&#xff09;和 TLB&#xff08;Translation Lookaside Buffer&#xff09;的影响。以下从缓存角度详…

六月一日python-AI代码

python 运行 import turtle as t # 导入turtle库并简称为t&#xff0c;用于图形绘制 import random # 导入random库&#xff0c;用于随机数生成t.delay(0) # 设置绘图延迟为0&#xff0c;加快绘图速度 colors ["red", "blue", "gr…

58、辣椒种植学习

辣椒&#xff08;学名&#xff1a;Capsicum annuum&#xff09;属于茄科辣椒属&#xff0c;是一种重要的蔬菜兼调味作物&#xff0c;具有较高的经济价值和营养价值。其果实富含维生素C、辣椒素等成分&#xff0c;既可鲜食&#xff0c;也可加工成干辣椒、辣椒粉、辣椒酱等产品&a…

C语言进阶--程序的编译(预处理动作)+链接

1.程序的翻译环境和执行环境 在ANSI C标准的任何一种实现中&#xff0c;存在两种不同的环境。 第一种是翻译环境&#xff1a;将源代码转换为可执行的机器指令&#xff08;0/1&#xff09;; 第二种是执行环境&#xff1a;用于实际执行代码。 2.详解编译链接 2.1翻译环境 程…