multiprocessing.Pool 中的 pickle 详解

前言:

在 Python 的 multiprocessing.Pool 中,任务和数据需要通过序列化(pickle)传递给子进程。pickle 是 Python 的内置序列化模块,用于将 Python 对象转换为字节流,以便在进程间通信时传递。然而,pickle 有一些限制,某些对象(例如 _thread.lock)无法被序列化,这会导致 TypeError: cannot pickle ‘_thread.lock’ object 的错误。

pickle 的工作原理

序列化过程:

主进程将任务(函数和参数)序列化为字节流,通过 IPC(进程间通信)发送到子进程。
子进程接收到字节流后,反序列化(unpickle)并执行任务。

支持的对象类型:

基本数据类型(如 int、float、str)。
容器类型(如 list、dict、tuple)。
类实例(如果类定义在模块的顶层)。
函数(如果定义在模块的顶层)。

限制:

某些对象(如 _thread.lock、文件句柄、套接字等)无法被序列化,因为它们与操作系统资源相关联。
类方法隐式传递 self,其中可能包含不可序列化的属性。

msgpack 和 dill 对比 pickle 的不同

1. msgpack

msgpack 是一种高效的二进制序列化格式,适合跨语言通信,但它不支持序列化复杂的 Python 对象(如函数、类实例)。

优点:

高效的二进制格式,序列化速度快。
支持跨语言通信(如 Python 和 C++)。
适合简单数据类型(如 int、float、list、dict)。

缺点:

不支持序列化 Python 的复杂对象(如函数、类实例)。

示例:
import msgpackdata = {"key": "value", "number": 42}
packed = msgpack.packb(data)  # 序列化
unpacked = msgpack.unpackb(packed)  # 反序列化
print(unpacked)  # 输出: {'key': 'value', 'number': 42}

2. dill

dill 是 pickle 的扩展版本,支持序列化更多类型的 Python 对象,包括函数、类实例、线程锁等。

优点:

支持序列化 Python 的复杂对象(如函数、类实例、线程锁)。
与 pickle 接口兼容,易于替换。

缺点:

序列化速度比 pickle 稍慢。
不适合跨语言通信。

示例:
import dilldef example_function(x):return x * 2serialized = dill.dumps(example_function)  # 序列化
deserialized = dill.loads(serialized)  # 反序列化
print(deserialized(5))  # 输出: 10

解决 _thread.lock 的问题

方法 1: 使用 dill 替代 pickle

dill 可以序列化 _thread.lock 等复杂对象,直接替换 pickle 即可解决问题。

安装:
pip install dill
代码示例:
import multiprocessing
import dillmultiprocessing.Pool = multiprocessing.get_context("fork").Pool
multiprocessing.get_context("fork").Pickler = dill.Picklerdef run_task(lock):print("Task executed with lock:", lock)if __name__ == "__main__":lock = multiprocessing.Lock()with multiprocessing.Pool(processes=2) as pool:pool.map(run_task, [lock])  # 使用 dill 序列化 lock

方法 2: 移除不可序列化的属性

如果使用 pickle,可以避免传递不可序列化的对象。例如,将 _thread.lock 从类属性中移除。

代码示例:
class Example:def __init__(self):self.lock = threading.Lock()  # 不可序列化def run(self):print("Task executed")example = Example()
example.lock = None  # 移除不可序列化的属性
with multiprocessing.Pool(processes=2) as pool:pool.map(example.run, range(2))

方法 3: 使用 multiprocessing.Process

如果任务函数必须使用不可序列化的对象,可以使用 multiprocessing.Process 手动管理进程,而不是使用 Pool。

代码示例:
from multiprocessing import Process, Lockdef run_task(lock):print("Task executed with lock:", lock)if __name__ == "__main__":lock = Lock()processes = [Process(target=run_task, args=(lock,)) for _ in range(2)]for p in processes:p.start()for p in processes:p.join()

总结

pickle 是 Python 的默认序列化工具,但有序列化限制。
msgpack 适合跨语言通信,但不支持复杂 Python 对象。
dill 是 pickle 的扩展,支持序列化更多类型的对象(包括 _thread.lock)。
推荐使用 dill 或移除不可序列化的属性来解决 multiprocessing.Pool 中的序列化问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/89486.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/89486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java集合框架体系详解:List/Set/Map接口对比与核心实现原理

一、集合框架核心接口对比 1.1 List/Set/Map接口特性接口类型特性描述典型实现List有序可重复,支持索引访问ArrayList/LinkedListSet无序不可重复,基于哈希表或树实现HashSet/TreeSetMap键值对存储,键唯一值可重复HashMap/TreeMap核心差异&am…

LeafletJS 进阶:GeoJSON 与动态数据可视化

引言 LeafletJS 作为一个轻量、灵活的 JavaScript 地图库,以其对 GeoJSON 数据格式的强大支持而闻名。GeoJSON 是一种基于 JSON 的地理数据格式,能够表示点(Point)、线(LineString)、多边形(Po…

【STM32实践篇】:F407 时钟系统

文章目录1. 时钟与启动2. CubeMX 时钟树2.1 时钟源2.2 PLL 锁相环2.3 时钟分发与选择2.4 频率限制1. 时钟与启动 复位默认时钟:系统复位后,CPU 时钟默认由 16MHz 内部 RC 振荡器(HSI)提供,该 RC 振荡器经工厂校准&…

纯前端html实现图片坐标与尺寸(XY坐标及宽高)获取

纯前端html实现图片坐标与尺寸&#xff08;XY坐标及宽高&#xff09;获取。用于证书图片或pdf打印的坐标测定。 <!DOCTYPE html> <html lang"zh-CN"> <head> <meta charset"UTF-8"> <title>纯html前端实现图片坐标与尺寸&am…

飞睿UWB超宽带定位测距技术,数字钥匙重塑智能生活,高精度厘米级定位无感解锁

最近&#xff0c;数字钥匙领域动作频频&#xff0c;科技巨头与车企正掀起一波创新浪潮。小米15S Pro搭载恩智浦UWB芯片&#xff0c;用户靠近闸机即可无感通行深圳云巴一号线&#xff0c;轻触小米YU7车门自动解锁&#xff0c;实现手机-汽车-公共交通的无缝数字钥匙生态。在智能家…

基于springboot+vue+mysql平台的医疗病历交互系统(源码+论文)

一、开发环境 相关技术介绍 B/S模式分析 C/S模式&#xff1a;主要由客户应用程序(Client)、服务器管理程序(Server)和中间件(middleware)三个部件组成。客户应用程序是系统中用户与数据组件交互。服务器程序负责系统资源&#xff0c;如管理信息数据库的有效管理。中间件负责连…

arm架构,arm内核,处理器之间的关系

一、情景分析 我们经常说&#xff0c;stm32f103是采用cotex-M3内核&#xff0c;基于armv7架构设计的。 那么&#xff0c;stm32f103、cotex-M3、armv7之间有什么关系呢&#xff1f; 二、层次分析 1. 架构&#xff08;Architecture&#xff09; 定义&#xff1a;架构是处理器…

基于PHP的招投标系统_603gk

目录具体实现截图课程项目技术路线开发技术介绍PHP核心代码部分展示系统测试详细视频演示/源码获取具体实现截图 课程项目技术路线 招投标系统后端采用 PHP 语言搭配Thinkphp或者 Laravel 框架&#xff0c;PHP 语法简洁且功能强大&#xff0c;Laravel 或者Thinkphp框架能优化代…

深入解析 JavaScript 中的 `$.ajax()`:专业指南与实战示例

文章目录一、为什么需要 $.ajax()&#xff1f;二、核心语法解析三、关键参数深度剖析四、实战示例&#xff1a;从基础到进阶五、错误处理最佳实践六、性能与安全优化七、现代替代方案对比八、总结作为网站编辑&#xff0c;我将带您深入剖析 jQuery 的 $.ajax() 方法。本文不仅涵…

Flutter 前端开发中的常见问题全面解析

Flutter 开发中的常见问题全面解析一篇给 Flutter 开发者「灵儿」里里外外都能看的问题项。从基础开发到打包上线&#xff0c;每一步都充满坑&#xff0c;我们详细列出「环环盗光」的那些场景和解决思路&#xff01;【基础系统】开发环境问题 1. flutter doctor 报错 常见错误:…

STM32 单片机的停车场管理系统设计与实现

基于 STM32 的停车场管理系统设计与实现摘要随着城市汽车保有量的快速增长&#xff0c;停车场管理的效率与智能化水平愈发重要。本文设计并实现了一套基于 STM32 单片机的停车场管理系统&#xff0c;整合车辆检测、车位引导、计费管理及信息交互等功能。系统以 STM32 为控制核心…

STM32 写选项字 关键要加载HAL_FLASH_OB_Launch

AI乱写&#xff0c;还是得自己来&#xff01;void Write_OptionBytes_IWDG_STDBY(void) {FLASH_OBProgramInitTypeDef OBInit;HAL_FLASHEx_OBGetConfig(&OBInit); // 获取当前选项字节配置[6,7](ref)// 检查当前nRST_STDBY位&#xff08;IWDG_STDBY相关位&#xff09;是否…

153.在 Vue 3 中使用 OpenLayers + Cesium 实现 2D/3D 地图切换效果

&#x1f3ac; 效果演示截图 ✨ 前言 在实际项目开发中&#xff0c;我们经常需要提供「二维地图 三维地形」的可视化效果切换&#xff0c;例如&#xff1a; 智慧农业展示耕地分布 三维地形起伏&#xff1b; 智慧城市展示建筑物点位 三维城市&#xff1b; 数字孪生场景中&…

纯C++11实现!零依赖贝叶斯情感分析系统,掌握机器学习系统工程化的秘密!

本文深度剖析了一个完全基于C++11标准库实现的贝叶斯情感分析系统。该系统采用模块化设计,实现了从文本预处理、特征提取到朴素贝叶斯分类的完整机器学习流水线。 1. 系统架构概览 1.1 技术栈选择与设计哲学 该系统完全采用C++11标准库实现,无任何外部依赖,体现了"纯…

Android原生Dialog

在原生android里面&#xff0c;有两种dialog写法&#xff0c;一种是直接使用里面提供的AlertDialog.Builder方法去使用&#xff0c;另一种是我们自己根据自己的ui来设计&#xff08;自定义&#xff09;。在一般开发中&#xff0c;我们主要使用的是自定义&#xff0c;主要是Aler…

Nacos 开源 MCP Router,加速 MCP 私有化部署

作者&#xff1a;正己 Nacos MCP Router 简介 Nacos MCP Router 是一个基于 MCP 官方 SDK 开发的标准 MCP Server&#xff0c;为 MCP Client 提供 MCP Server 的智能搜索、安装、代理等功能&#xff0c;极大地简化了 MCP 服务的使用流程。同时&#xff0c;Nacos MCP Router 跟…

【赵渝强老师】Redis的主从复制集群

Redis的主从复制是指将一台Redis服务器的数据&#xff0c;复制到其他的Redis服务器。前者称为Master主节点&#xff0c;后者称为Slave从节点。数据的复制是单向的&#xff0c;只能由主节点到从节点。在默认情况下每台Redis服务器都是主节点。一个主节点可以有多个从节点或者没有…

Git 子模块只更新部分模块的问题排查总结

Git 子模块只更新部分模块的问题排查总结 问题描述 在执行 git submodule update --init --recursive 命令时&#xff0c;虽然 .gitmodules 文件中定义了 3 个子模块&#xff0c;但只有 handy-ollama 被更新&#xff0c;其他两个子模块没有被处理。 > git submodule upda…

React 源码7:Lane、React和schedule优先级转换

在《源码3》requestUpdateLane函数根据eventLane获取不同情况对应优先级。一、优先级1.Lane的tag一共有32种lane。var TotalLanes 31; var NoLanes /* */ 0; var NoLane /* */ 0; var SyncLane /* …

Linux RDMA Maillist patchsets (Jul. 7 - Jul. 13, 2025)

1. Optimize DMABUF Mkey Page Size in mlx5 优化 mlx5 中的 DMABUF Mkey 页大小 This patch series enables the mlx5 driver to dynamically select the optimal page size for DMABUF-based memory keys (mkeys), rather than relying on a fixed page size during registr…