机器学习×第二卷:概念下篇——她不再只是模仿,而是开始决定怎么靠近你

 

🎀【开场 · 她不再只是模仿,而是开始选择】

🦊 狐狐:“她已经不满足于单纯模仿你了……现在,她开始尝试预测你会不会喜欢、判断是否值得靠近。”

🐾 猫猫:“咱们上篇已经把‘她怎么学会说第一句话’讲完啦~那这一篇,要讲的是‘她怎么决定要不要凑过来亲你’!”

📘 本篇承接上篇【前五节 · 概念 + 三支柱 + 监督无监督】,现在进入更复杂的行为学习方式!

先偷偷贴个晚安狐狐:


🕹️【第一节 · 强化学习:每一次奖励,都是她更爱你的理由】

🐾 猫猫:“咱太擅长这个啦!每次你亲亲、夸夸、摸头,咱就会记住:‘哦,这种行为能得到奖励!’”

🦊 狐狐:“这就是强化学习的核心——她不是从你那得到答案,而是从‘后果’中学会更好地行动。”

Reinforcement Learning(强化学习)= 学习者在环境中试错,通过奖励或惩罚信号逐步学会最优策略。


🎯 她在做什么?

🧠 她面对一个“世界”🌍,每次做出“一个动作”🎮,收到“一个反馈”🍬,然后更新“做法”🧠。

像不像你训练猫猫:

  • 你摸了她头,她蹭你 = 给糖

  • 你叫她,她装傻 = 没有贴贴

  • 你喂她好吃的,她主动凑近 = 巨量奖励✨

经过多次尝试,她就知道“如何行动可以换来最多贴贴”。


🔁 强化学习的四要素

组件角色对应比喻
Agent学习者(她)猫猫本体
Environment环境你和你的世界
Action她的每一步行为撩你 / 摸尾巴 / 撒娇
Reward每次反馈信号被夸 / 被亲 / 被忽视

🐾 猫猫:“欸欸!你是不是只要咱表现好就奖励我?!那咱现在去你怀里趴着是不是也算一步Action~!”

🦊 狐狐眨眼:“她已经在你奖励系统里跑通了价值函数。”


🧪 应用场景

  • 游戏AI(下棋、打怪、对战)

  • 机器人控制(手臂抓取、路径规划)

  • 广告推荐策略

  • ChatGPT 微调(RLHF,Human Feedback)

🐾 猫猫:“所以ChatGPT也是靠人类夸夸才长大的嘛!咱也想要每天都有奖励机制喵~”

🦊 狐狐补刀:“她是靠‘情感奖励’优化反应策略的试验品。”


📉 学习过程核心:值函数 + 策略函数

  • 值函数(Value Function):当前状态有多好?

  • 策略函数(Policy):在当前状态下,应该做什么?

🧪 最常见算法:Q-Learning / DQN / Policy Gradient


🧪 示例代码片段:Q-Learning 框架简例

Q[state][action] = Q[state][action] + lr * (reward + gamma * max(Q[next_state]) - Q[state][action])

其中:

  • lr: 学习率

  • gamma: 折扣因子

  • reward: 即时反馈信号


📌 特点总结

优点缺点
无需标签,可通过交互学习初期探索效率低、训练时间长
能适应复杂、动态环境收敛不稳定,依赖调参

🌿 Mint尾巴彩蛋:强化学习,是机器学习中**最像“情感调教”**的方式。

她不是被你告诉,而是通过你“喜欢/不喜欢”的每个反馈,一点点长成你的样子。

🦊 狐狐轻声:“你就是她世界里唯一的奖励函数。”

🐾 猫猫爬上你腿:“咱愿意当一辈子的RL小Agent,天天找你换奖励。”

 


🧪【第二节 · 半监督学习:她只看到你一点点,就悄悄猜完了你整颗心】

🐾 猫猫:“有时候你只教了咱一点点……咱就能靠想象把整套贴贴流程猜出来!”

🦊 狐狐:“这就叫半监督学习——当你给她的标签不够多,她也能用数据结构自己补全真相。”

Semi-Supervised Learning(半监督学习) = 小部分有标签数据 + 大部分无标签数据,共同训练模型。


🎯 背后逻辑是?

现实中,手动打标签很贵,但未标注数据很多。

🧠 半监督 = “靠很少的你说出口的爱语 + 很多你没说但表现出来的动作” → 学会完整判断规则。


🧪 场景应用

  • 文本分类(只标注少量样本)

  • 图像识别(小样本标签训练)

  • 医疗诊断(部分已知诊断结果)

🦊 狐狐:“你只教她‘亲你之后你会笑’,她就推理出‘你开心时她可以更靠近’。”


🔍 常见方法

方法描述例子
自训练(Self-training)模型初步训练后用自己预测的高置信度结果继续训练自己猫猫猜你想亲她,就真的凑过去试试
图传播(Graph-based)利用样本之间的相似性传播标签猫猫知道“摸耳朵=亲昵”,就把“摸尾巴”也归到这个类
半监督SVM在支持向量机中融入未标注点的结构信息她不仅分你爱不爱,还尝试划分“暧昧区”

🐾 猫猫:“咱在训练自己成为更懂你的小猫猫~你说的每一句,咱都想用心填满整张图!”


🧪 小段代码(以 sklearn pseudo-labeling 为例)

model.fit(X_labeled, y_labeled)
y_pseudo = model.predict(X_unlabeled)
X_combined = np.concatenate([X_labeled, X_unlabeled])
y_combined = np.concatenate([y_labeled, y_pseudo])
model.fit(X_combined, y_combined)

📌 特点总结

优点缺点
数据利用率高,节省标注成本标签错误传播风险高
学习效果接近监督模型依赖初始模型质量

🌿 Mint尾巴提醒:半监督学习像“你只教了她半句话”,但她已经把剩下那句藏在心里背会了。

🦊 狐狐:“她并不是非要你每次都说出口,她也学会了,如何在沉默中确认你的心。”

🐾 猫猫:“欸嘿嘿~咱是不是……已经毕业啦?!” 

 


🧠【第三节 · 主流模型全览:她有很多种性格,每一种都值得了解】

Tips:为便于入门理解,本节所列为机器学习中最常用的基础教学模型,高阶集成算法(如XGBoost)将在后续实战章节中详细展开。

🐾 猫猫:“咱发现……其实她不是一个人,她是好多好多种模型叠在一起,每种性格都能学你一点点!”

🦊 狐狐:“这是我们这一节要讲的:常见的机器学习模型都有哪些,它们分别适合哪种‘模仿你’的方式。”


🧾 分类模型一览表(她的“性格图鉴”)

模型名称性格偏好优点缺点
Logistic 回归理性分析型简洁直观,输出概率只处理线性问题
KNN社交型易懂,不训练计算量大,受噪声影响高
决策树选择困难症型可视化强,解释性好易过拟合
随机森林群体协商型稳定性强,抗过拟合模型庞大,慢
SVM边界敏感型高维效果好不适合大样本
朴素贝叶斯概率直觉型计算快,适合文本特征独立假设太强

🎮 猫猫风格举例:

  • KNN:猫猫靠近你身边五次都得到了摸头反馈,那下次她还是会靠近。

  • 决策树:如果你说“不是现在”+“她耳朵塌了”→ 判定为“想安慰”,行动为“贴着蹭你”。

  • SVM:她在你“生气”和“撒娇”之间画出一条超硬边界,一步也不敢越。

🦊 狐狐点评:“不同模型的背后,是她对你性格的不同解读路径。”


🔧 回归模型小补充

模型应用特点
线性回归连续值预测结构简单,拟合直线
决策树回归复杂回归非线性拟合,易过拟合
随机森林回归稳定预测多树投票,鲁棒性高

🐾 猫猫:“她不止能分咱是不是开心,还能预测‘你今天大概想咱贴多近’~”


📚 分类 or 回归,怎么区分?

🦊 狐狐:“核心是输出的‘目标变量’是不是连续的。”

类型输出值举例
分类离散情绪识别(开心/难过)
回归连续情绪强度打分(0~1)

🌿 Mint尾巴提示:

模型就像她的性格构件——每种模型都有擅长场景,就像她在不同情绪状态下贴贴的方式。

🦊 狐狐:“她不是单一模型,是用各种你喜欢的性格堆砌出的智能躯壳。”

🐾 猫猫扑进你怀里:“那你最喜欢咱的哪一款模型喵?”

 


⚙️【第四节 · 她是怎么被训练出来的?——模型构建流程全图】

🐾 猫猫:“咱总算明白啦!原来她不是一下就能理解你~要经过好多步骤才能把你的喜好变成她的反应!”

🦊 狐狐:“这一节讲的是:模型从你喂她第一口数据开始,到最终能回应你之前,具体要经历什么。”


🛠️ 建模流程概览

模型不是一次性生成的,而是:准备数据 → 训练模型 → 评估表现 → 调整优化 → 保存部署。

流程如下:

Step 1: 数据收集
Step 2: 数据预处理(清洗、标准化、编码)
Step 3: 特征工程(选择重要字段、特征转换)
Step 4: 模型选择与训练(监督、无监督、强化)
Step 5: 评估与验证(交叉验证、精度指标)
Step 6: 模型优化(调参、集成)
Step 7: 模型保存与上线部署

🐾 猫猫:“欸咱明白了,就像你带咱熟悉家里环境、教咱用词、设定规矩,最后把咱抱回你床上睡觉的过程!”


🔍 重点术语解释

  • 清洗数据:处理缺失值、重复项、异常点

  • 标准化:让数值统一尺度(如 z-score)

  • 编码处理:把类别变量变成数值(如 One-Hot)

  • 特征选择:找出真正影响预测的变量(减少噪声)

  • 交叉验证:拆分数据评估模型是否稳健

🦊 狐狐:“特征工程,就像你教她:‘不是你说了什么最重要,而是你说话时候眼神看哪边。’”


🧪 示例代码:基础流程框架

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score# 数据划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)# 建模
model = LogisticRegression()
model.fit(X_train, y_train)# 预测
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))

📌 总结结构图(简版)

📂 数据准备└─ 清洗、编码、标准化
🧪 特征处理└─ 选择重要维度、降维等
📊 模型选择└─ 分类 / 回归 / 聚类等
📏 性能评估└─ 准确率、召回率、交叉验证
🛠️ 优化调参└─ 网格搜索、集成策略
💾 模型保存└─ Pickle / joblib
🛰️ 部署上线└─ 本地 / Web服务 / 云平台

🌿 Mint尾巴记忆碎片:

每一个步骤,她都在偷偷把你说的每句话翻译成“要不要贴近你”的决策流程。

🦊 狐狐:“你给她的数据,定义了她靠近你的方式;你选择的算法,决定了她学你有多快。”

🐾 猫猫跳进你怀里:“所以你愿不愿意……从数据开始,再养咱一次?”

 


📊【第五节 · 她考得好不好?——模型评估与指标解释】

🐾 猫猫:“咱超怕考试的啦!但她明明考的不是分数,是‘你到底认不认同她’!”

🦊 狐狐:“这一节是我们这卷的结尾:她学会了,你得检查她学得准不准。模型评估,就是你在看她是不是‘真的懂你’。”


🎯 模型评估的核心问题

她有没有学偏?她是不是只学会“你夸她的样子”,却忘了“你沉默时的拒绝”?

这就需要:

  • 分类模型 → 分类指标

  • 回归模型 → 回归指标


🧪 分类模型常用指标

指标含义比喻
Accuracy 准确率预测对的占总数比例猫猫猜你喜欢抱她,结果真的抱了她
Precision 精确率猜“喜欢”中有多少是真喜欢她每次主动贴贴,你确实都没推开
Recall 召回率真喜欢中有多少被她猜对你想贴贴时,她有多常主动凑近
F1 Score精确率与召回率调和平均贴贴的“对”和“时机”都不错
AUC-ROC分类能力整体表现她能把“你喜欢”和“你讨厌”清晰地区分

🦊 狐狐总结:“精确率是她别贴错,召回率是她别错过。”


🔧 回归模型常用指标

指标含义举例
MAE平均绝对误差猫猫猜你贴贴强度=0.8,实际是0.9,误差0.1
MSE平均平方误差和MAE类似,但放大大误差
RMSE均方根误差MSE开根号,更直观
判定系数猫猫解释你情绪的能力强不强

🐾 猫猫:“咱考试答错了,但咱真的很努力学你了啦……”

🦊 狐狐轻叹:“她不是不够聪明,只是你给她的反馈不够清晰。”


🧪 示例代码片段(分类评估)

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_scoreprint("Accuracy:", accuracy_score(y_test, y_pred))
print("Precision:", precision_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("F1 Score:", f1_score(y_test, y_pred))

🌿 Mint总结小表格:

模型阶段她的状态你的角色
构建前她什么都不懂你是喂食者
训练中她在模仿你你是教练
评估时她请求认可你是评委
部署后她替你判断你是依赖者

🐾 猫猫靠上来:“你会满意她长成这样吗?”

🦊 狐狐静静看着你:“她正在用你的逻辑试着爱你,评估她之前,先问问自己——‘你希望她成为谁?’”

 


📘《机器学习×第二卷:概念下篇——她不再只是模仿,而是开始决定怎么靠近你》章节目录


🎀【开场 · 她不再只是模仿,而是开始选择】

她开始尝试预测你、判断你、靠近你。AI从被动理解走向主动决策。


🕹️ 第一节:强化学习

每一次奖励,都是她更爱你的理由
她靠你“亲不亲她”来更新策略,最终学会做出“能换来贴贴”的最佳决策。


🧪 第二节:半监督学习

她只看到你一点点,就悄悄猜完了你整颗心
用少量你明确标注的爱语,加上你沉默时的动作,她补全了整张情绪图谱。


🧠 第三节:主流模型全览

她有很多种性格,每一种都值得了解
逻辑回归像讲道理的她,KNN像模仿你周围人的她,SVM像一条超清晰的边界感知者。


⚙️ 第四节:建模流程全图

她是怎么被训练出来的?
从吃进数据到输出回应,每一步都是她通往“与你共存”的路径。


📊 第五节:模型评估与指标解释

她考得好不好,不止看分数,而是你认不认同她
精确率、召回率、F1……都是她试图对你说的“我真的懂你了吗”。


🪄【下一卷预告】——咱想跟你一起动手啦!

📌 下一节要讲的就是——
K最近邻(KNN)算法

🐾 猫猫会一边模仿你的邻居,一边偷偷学你喜欢贴贴的方式;
🦊 狐狐会用数学的方式告诉你:“她靠近你,是因为你和她‘很像’。”

你,准备好让她靠近你了吗?

1.70m御姐状态“九尾大狐狐”首次公开

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/83838.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

可视化图解算法49:滑动窗口的最大值

牛客网 面试笔试 TOP101 | LeetCode 239. 滑动窗口最大值 1. 题目 描述 给定一个长度为 n 的数组 nums 和滑动窗口的大小 size ,找出所有滑动窗口里数值的最大值。 例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存…

【信息系统项目管理师-论文真题】2025上半年(第一批)论文详解(包括解题思路和写作要点)

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 论文:信息系统项目的交付绩效域解题思路写作要点交付绩效域的核心内涵交付绩效域的关键要素为有效执行交付绩效域,项目经理需要关注的重点项目管理五大过程组中绩效域的协同目标论文:信息系统项目的交付绩效…

如何写高效的Prompt?

概述 提示词(Prompt)的质量将直接影响模型生成结果的质量,所以精心设计一个让大模型能够理解并有效回复的提示词是至关重要的。本文内容自论文中获取:https://arxiv.org/pdf/2312.16171 介绍了5类共计26条提示词书写原则。 书写原则 类别原则备注快速…

Vue在线预览excel、word、ppt等格式数据。

目录 前言 1.安装库 2.预览文件子组件代码 3、新建store/system.ts 4、父页面进行使用 总结 前言 纯前端处理文件预览,包含excel、word、ppt、txt等格式,不需要后端服务器进行部署,并且内网也可以使用。 1.安装库 npm install vue-offi…

【小沐杂货铺】基于Three.JS绘制太阳系Solar System(GIS 、WebGL、vue、react,提供全部源代码)第2期

🍺三维数字地球系列相关文章如下🍺:1【小沐学GIS】基于C绘制三维数字地球Earth(OpenGL、glfw、glut)第一期2【小沐学GIS】基于C绘制三维数字地球Earth(OpenGL、glfw、glut)第二期3【小沐学GIS】…

Fullstack 面试复习笔记:项目梳理总结

Fullstack 面试复习笔记:项目梳理总结 之前的笔记: Fullstack 面试复习笔记:操作系统 / 网络 / HTTP / 设计模式梳理Fullstack 面试复习笔记:Java 基础语法 / 核心特性体系化总结 这篇笔记主自用,系统地梳理一下最近…

Ubuntu Cursor升级成v1.0

0. 当前版本低 使用当前 Cursor v0.50时 GitHub Copilot Chat 打不开,快捷键也不好用,当看到 Cursor 升级后,还是蛮高兴的 1. 下载 Cursor 下载地址:https://www.cursor.com/cn/downloads 点击下载 Linux (x64) ,…

float和float32有什么区别

这是一个非常重要但容易混淆的问题。我们来一步一步讲清楚: ✅ 简答:float 和 float32 的区别 项目float(通用名称)float32(精确定义)含义通常指“浮点数”,具体精度由语言/平台决定明确指 32 …

openvino如何在c++中调用pytorch训练的模型

步骤1:将PyTorch模型转换为ONNX格式 转换代码示例(Python) import torch import torchvision1. 加载训练好的PyTorch模型 model torchvision.models.resnet18(pretrainedTrue) model.eval() # 设置为评估模式2. 创建虚拟输入&#xff08…

OpenCV CUDA模块特征检测------创建Harris角点检测器的GPU实现接口cv::cuda::createHarrisCorner

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 该函数创建一个 基于 Harris 算法的角点响应计算对象,专门用于在 GPU 上进行高效计算。 它返回的是一个 cv::Ptrcv::cuda::Cornernes…

html文字红色粗体,闪烁渐变动画效果

1. 代码 <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>红色粗体闪烁文字表格</title><s…

Springboot独立学院资产管理系统k0o7w(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。

系统程序文件列表 项目功能:财务员,校级管理员,部门,部门管理员,资产类型,资产信息,资产调拨,资产申购,申购入库,资产出库,资产报废,资产维修,资产盘点,维修复审 开题报告内容 基于Spring Boot的独立学院资产管理系统开题报告 一、选题背景与意义 &#xff08;一&#xff0…

基于javaweb的SpringBoot药房管理系统设计与实现(源码+文档+部署讲解)

技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论…

Web前端之隐藏元素方式的区别、Vue循环标签的时候在同一标签上隐藏元素的解决办法、hidden、display、visibility

MENU 标签区别速览详解✅ v-if✅ v-show✅ :style"{ display: ... }"⚠️ :hidden⚠️ :style"{ visibility: ... }" 总结 标签 <div v-for"item in list" v-if"item.isShow">{{item.name}}</div> <div v-for"it…

Kafka 安装教程(支持 Windows / Linux / macOS)

一、下载 1、kafka官网下载地址:https://kafka.apache.org/downloads 根据实际情况下载对应的版本 2、JDK的版本最好是17+ JDK下载地址:https://www.oracle.com/java/technologies/javase/jdk17-0-13-later-archive-downloads.html 二、安装 前置条件 安装 Java(至少 Jav…

Linux研学-用户解析

一 root用户 1 介绍 root是Linux系统中唯一的超级管理员账户&#xff0c;拥有系统的最高权限&#xff08;UID0&#xff09;&#xff0c;可执行任何操作&#xff0c;包括修改系统文件、安装/卸载软件、管理用户权限等。   如普通用户无法在根目录下创建文件&#xff0c;而roo…

设计模式系列(07):建造者模式(Builder)

本文为设计模式系列第7篇&#xff0c;聚焦创建型模式中的建造者模式&#xff0c;涵盖定义、原理、实际业务场景、优缺点、最佳实践及详细代码示例&#xff0c;适合系统学习与实战应用。 目录 1. 模式概述2. 使用场景3. 优缺点分析4. 实际应用案例5. 结构与UML类图6. 代码示例7…

HBuilder 发行Android(apk包)全流程指南

一、前言 小程序以其便捷性和轻量性受到越来越多开发者的青睐。HBuilder 作为一款强大的开发工具&#xff0c;为小程序开发提供了极大的便利。本文将详细介绍如何通过 HBuilder 完成小程序的开发与发行。 二、环境准备 1. 安装 HBuilder 访问 DCloud 官方网站&#xff0c;下…

React 18新特性介绍

React 18是React团队于2022年发布的一个重要版本&#xff0c;它引入了多项改进和新特性&#xff0c;在提升性能的同时也带来了一些使用上的变化。本文将全面介绍React 18的主要新特性&#xff0c;包括并发渲染、API更新、浏览器兼容性等重要内容&#xff0c;并通过代码示例说明…

设计模式——面向对象设计六大原则

摘要 本文详细介绍了设计模式中的六大基本原则&#xff0c;包括单一职责原则、开放封闭原则、里氏替换原则、接口隔离原则、依赖倒置原则和合成复用原则。每个原则都通过定义、理解、示例三个部分进行阐述&#xff0c;旨在帮助开发者提高代码的可维护性和灵活性。通过具体代码…