Python 机器学习核心入门与实战进阶 Day 6 - 模型保存与加载(joblib / pickle)

✅ 今日目标

  • 掌握如何将训练好的模型持久化保存到文件
  • 熟悉两种主流保存方式:joblibpickle
  • 加载模型并应用于新数据预测
  • 实现完整的“训练 → 保存 → 加载 → 预测”流程
  • 为后续部署做准备(如 Flask、FastAPI)

🧰 一、模型保存工具对比

工具特点推荐场景
picklePython 原生序列化工具,支持任意对象通用保存
joblib专为 NumPy / sklearn 设计,速度快大模型保存

🧪 二、基本用法示例

✅ 使用 joblib

from joblib import dump, load# 保存模型
dump(model, 'model.joblib')# 加载模型
model = load('model.joblib')

✅ 使用 pickle

import pickle# 保存
with open('model.pkl', 'wb') as f:pickle.dump(model, f)# 加载
with open('model.pkl', 'rb') as f:model = pickle.load(f)

🧠 三、完整流程练习建议

  1. 使用 SVC 训练一个模型(可复用之前数据)
  2. 使用 joblib 保存模型
  3. 清空变量,重新加载模型
  4. 对测试集进行预测,验证效果是否一致
  5. 可封装为 model_utils.py 工具模块

🧾 今日总结

学会了什么用来干嘛
joblib.dump/load()快速保存/加载模型
pickle.dump/load()更通用但稍慢
模型持久化流程为部署和复用做准备

📁 练习脚本:save_load_model_demo.py

# SVM 模型保存与加载演示(使用 joblib)import numpy as np
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from joblib import dump, load# 构造数据
np.random.seed(42)
size = 100
scores = np.random.randint(40, 100, size)
genders = np.random.choice([0, 1], size=size)
labels = (scores >= 60).astype(int)X = np.column_stack(((scores - scores.mean()) / scores.std(), genders))
y = labelsX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 训练模型
model = SVC(kernel='rbf', C=1.0, gamma='scale')
model.fit(X_train, y_train)# 保存模型
dump(model, 'svm_model.joblib')
print("模型已保存为 svm_model.joblib")# 加载模型
loaded_model = load('svm_model.joblib')
print("模型已加载成功")# 预测与评估
y_pred = loaded_model.predict(X_test)
print("测试集准确率:", accuracy_score(y_test, y_pred))

运行输出:

模型已保存为 svm_model.joblib
模型已加载成功
测试集准确率: 1.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913554.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913554.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【SigNoz部署安装】Ubuntu环境部署SigNoz:Docker容器化监控的全流程指南

文章目录前言1.关于SigNoz2.本地部署SigNoz3.SigNoz简单使用4. 安装内网穿透5.配置SigNoz公网地址6. 配置固定公网地址前言 在分布式架构主导的现代运维体系中,系统性能监控正面临范式变革的关键转折。当微服务架构遭遇服务雪崩、无服务器架构出现冷启动延迟等复杂…

NV298NV312美光固态闪存NW639NW640

美光固态闪存技术全景解析:从NV298到NW640的深度探索近年来,美光科技凭借其在3D NAND闪存技术上的持续突破,推出了多款备受市场关注的固态硬盘产品。本文将从技术评测、产品对比、市场趋势、用户反馈及应用场景等多个维度,深入剖析…

2025.07.04【服务器】|使用万兆网卡提升服务器间互联速度,实现快速数据传输

文章目录1. **万兆网卡概述**2. **为什么选择万兆网卡**3. **万兆网卡配置与安装**3.1 **安装网卡**3.2 **安装驱动程序**3.3 **检查网卡状态**4. **配置网络接口**4.1 **Linux 系统配置**4.2 **Windows 系统配置**5. **优化性能**5.1 **使用多线程传输**5.2 **开启 TCP/UDP 窗…

光伏发电量精准估算,提升投资效益

在光伏产业规模化发展进程中,准确估算光伏发电量是提升项目投资效益的关键环节。科学的发电量预测不仅能为项目可行性研究提供依据,更能在电站全生命周期内优化运营策略,实现投资回报最大化。基于多维度数据整合与智能算法构建的精准预测体系…

Linux的互斥锁、Linux的POSIX信号量(二值、计数)、RTOS的二值信号量

锁和信号量最大的区别就是:锁严格要求 “谁占用谁释放”,而信号量允许 “一个任务 / 线程释放,另一个任务 / 线程获取”。 特性互斥锁(Mutex)POSIX 信号量(Semaphore)初始状态初始为 “锁定”(PTHREAD_MUTEX_INITIALIZER),需显式获取(pthread_mutex_lock)。初始值可…

基于Java+SpringBoot 协同过滤算法私人诊所管理系统

源码编号:S607源码名称:基于SpringBoot5的协同过滤算法的私人诊所管理系统用户类型:双角色,患者、医生、管理员数据库表数量:15 张表主要技术:Java、Vue、ElementUl 、SpringBoot、Maven运行环境&#xff1…

什么是DINO?

DINO 是一个由 Meta AI (当时的 Facebook AI) 在 2021 年提出的自监督学习框架,其全称是 “self-DIstillation with NO labels”,直译为“无标签的自我蒸馏”。这个名字精准地概括了它的核心思想。 DINO 的出现是一个里程碑,因为它首次有力地…

如何在 Android Framework层面控制高通(Qualcomm)芯片的 CPU 和 GPU。

如何在 Android Framework层面控制高通(Qualcomm)芯片的 CPU 和 GPU。 参考:https://blog.csdn.net/YoungHong1992/article/details/117047839?utm_source%20%20uc_fansmsg 作为一名 Framework 开发者,您拥有系统级的权限&#…

程序员在线接单

十年Java全栈工程师在线接单Java程序代做,兼职接单,系统代做,二次开发,网站开发部署,项目合作,商业项目承包 全栈开发,支持定制各种管理系统、小程序 商用或个人使用等项目都接 服务二: Java调试…

Python 异步爬虫(aiohttp)高效抓取新闻数据

一、异步爬虫的优势 在传统的同步爬虫中,爬虫在发送请求后会阻塞等待服务器响应,直到收到响应后才会继续执行后续操作。这种模式在面对大量请求时,会导致大量的时间浪费在等待响应上,爬取效率较低。而异步爬虫则等待可以在服务器…

Jenkins Pipeline(二)

1.Pipeline 变量 在 Jenkins 管道(Pipeline)中,变量是一种非常有用的功能,它们可以帮助你在构建过程中存储和传递数据。Jenkins 管道支持多种方式来定义和使用变量,包括环境变量、脚本变量以及全局变量。 1.2 脚本变…

springsecurity02

提前打开Redis1)通过内置的用户名和密码登录spring-boot-starter-security.jar2)使用自定义用户名和密码登录UserDetailService自定义类实现UserDetailService接口,重写loadUserByUsername方法class UserDetailServiceImpl implements UserDe…

Apache组件遭大规模攻击:Tomcat与Camel高危RCE漏洞引发数千次利用尝试

漏洞态势分析帕洛阿尔托网络公司Unit 42团队最新研究报告显示,针对Apache Tomcat和Apache Camel关键漏洞的网络攻击正在全球激增。2025年3月披露的这三个远程代码执行(RCE, Remote Code Execution)漏洞——CVE-2025-24813(Tomcat&…

Odoo 中国特色高级工作流审批模块研发

本文旨在为基于Odoo 18平台开发一款符合中国用户习惯的、功能强大的通用工作流审批模块提供一份全面的技术实现与产品设计方案。该模块的核心特性包括:为最终用户设计的图形化流程设计器、对任意Odoo模型的普适性、复杂的审批节点逻辑(如会签、条件分支、…

unplugin-vue-components 最佳实践手册

🎨 unplugin-vue-components 最佳实践手册 整理不易,收藏、点赞、关注支持下!本文详细介绍了 unplugin-vue-components 插件的作用、配置方法、常用场景及与 unplugin-auto-import 配合使用的实战技巧,特别适合 Vue 3 Vite 项目。…

⿻ Java 学习日志 01

Java 运行机制: 原文件>编译器>字节码(class后缀)>JVM虚拟机>操作系统既有编译的过程也有解释的过程。JVM:Java Virture Machine/执行字节码的虚拟机,是实现跨平台——Java核心机制的核心。 JRE&…

基于Flutter的web登录设计

基于Flutter的web登录设计 1. 概述 本文档详细介绍了基于Flutter Web的智能家居系统登录模块的设计与实现。登录模块作为系统的入口,不仅提供了用户身份验证功能,还包括注册新用户的能力,确保系统安全性的同时提供良好的用户体验。 本文档…

Maven继承:多模块项目高效管理秘笈

Maven继承是Maven项目管理中的核心机制,允许子模块共享并统一管理父模块的配置信息(尤其是依赖关系),其核心原理与Java中的类继承类似。以下是关键要点解析:一、核心概念与作用消除配置冗余 多个子模块共享相同依赖&am…

关于系统无法找到 arm-linux-gcc 命令,这表明你的环境中尚未安装 ARM 交叉编译工具链。以下是详细的解决方案:(DIY机器人工房)

1. 错误原因分析 错误信息:无法将“arm-linux-gcc”项识别为 cmdlet/函数/程序 这说明 Windows 或 Cygwin 环境中没有安装 ARM 交叉编译工具,或者工具路径未添加到系统 PATH 中。当前环境: 你之前使用的是 Cygwin 环境下的 x86_64 架构 GCC&…

redis一篇入门

一、Redis 安装 Linux 系统安装通过包管理器安装 (以 Ubuntu 为例): sudo apt update sudo apt install redis-server从源码编译安装: wget https://download.redis.io/redis-stable.tar.gz tar -xzvf redis-stable.tar.gz cd redis-stable make sudo make installWindows 安装…