8.14 机器学习（1）

8.14 机器学习（1）

pingmian/2025/8/16 22:36:27/文章来源:https://blog.csdn.net/2301_82188844/article/details/150389430

机器学习基础

一、什么是机器学习

定义：让计算机利用大量数据在特定任务上持续改进性能的过程，可以让任务完成的更好。

机器学习的领域很多。

二、机器学习基本术语

数据集、样本、特征（属性）、属性空间、向量表示、训练集（训练模型的数据集合，含标记信息）、测试集（测试模型的数据集合）

三、主要学习任务（以好瓜坏瓜为例子）

监督学习：已知正确答案和参数，达到要求的学习过程。
- 分类：输出的结果位有限，离散型（好瓜/坏瓜）。
- 回归：输出某个范围内任何数值，连续型（房价预测）。
无监督学习：提供数据集合，不提供有信息的学习过程。
- 聚类：把样本按相似度分组。
- 关联分析：尿布 → 葡萄酒推荐。
集成学习
①结合多个弱学习器提升整体性能。

四、模型评估与选择

误差
1. 训练误差（经验误差）：在训练集上的误差。
2. 泛化误差：在新样本上的期望误差。
3. 错误率：错误的样本占样本总数的比例。
4. 残差：实际预测输出与样本真实输出的差异。
拟合状态
1. 欠拟合：模型太简单，训练误差高。
  → 解决：增加特征、提高模型复杂度、减小正则化。
2. 过拟合：模型太复杂，训练误差低但泛化误差高。
  → 解决：增数据、降维、正则化、集成学习。
3. 损失函数：衡量模型预测误差大小的函数。（损失函数越小越好）
评估方法
1. 留出法：70 % 训练 / 30 % 测试，分层采样。
2. k 折交叉验证：常用 10 折，取 k 次平均。
性能指标（二分类）
1. TP, FP, TN, FN
2. 查准率 P = TP / (TP+FP)
3. 查全率 R = TP / (TP+FN)

五、选择模型的原则

奥卡姆剃刀：在可解释数据的前提下选最简单模型。

没有免费午餐（NFL）：脱离具体任务谈算法优劣无意义。

机器学习=数据+算法+评估

用经验提升任务性能，警惕欠拟合与过拟合，通过交叉验证和性能指标选择最适合实际问题的简洁模型。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/93213.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/93213.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

给电脑升级内存，自检太慢，以为出错

给电脑升级内存，自检太慢，以为出错

公司电脑是16G内存，用虚拟机时非常吃力。于是跟领导说，买了32G内存和1T SSD。电脑有两个SATA数据线，SATA电源头只有一个。于是买了几个1转2，顺利接上。把原来的16G拔下，换上32G内存。结果开机没反应。心里就有点嘀咕&a…

阅读更多...

Effective C++ 条款43：学习处理模板化基类内的名称

Effective C++ 条款43：学习处理模板化基类内的名称

Effective C 条款43：学习处理模板化基类内的名称核心思想：模板化基类（templatized base classes）中的名称在派生类模板中默认不可见，需要通过this->前缀、using声明或显式基类限定来引入。这是因为编译器在解析模板…

阅读更多...

Mybatis简单练习注解sql和配置文件sql+注解形式加载+配置文件加载

Mybatis简单练习注解sql和配置文件sql+注解形式加载+配置文件加载

项目结构 d:\test\runjar\data\static\data\mybatis_helloworld\Mybatis\ ├── lib\ │ ├── asm-3.3.1.jar │ ├── c3p0-0.9.1.2.jar │ ├── cglib-2.2.2.jar │ ├── commons-logging-1.1.1.jar │ ├── ehcache-core-2.6.8.jar │ ├── javassi…

阅读更多...

抗日胜利80周年 | HTML页面

抗日胜利80周年 | HTML页面

飞翔的和平鸽；屹立的人民英雄纪念碑；倒下的日本国旗；旋转的金色勋章无不代表着我们胜利了！！！HTML源代码： <!DOCTYPE html> <html lang"zh-CN"> <head><meta cha…

阅读更多...

web仿写网站

web仿写网站

一、完成自己学习的官网，至少三个不同的页面。1、界面1（1）代码<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-wid…

阅读更多...

基于element-plus和IndexedDB数据库的基础表单

基于element-plus和IndexedDB数据库的基础表单

本文介绍了基于Vue 3和Element Plus的表单项目配置页面实现。页面包含搜索栏、操作按钮、数据表格和分页组件，使用IndexedDB进行本地数据存储。主要功能包括：1) 通过模糊查询搜索项目；2) 分页显示项目数据；3) 添加/编辑/删除项目操…

阅读更多...

paimon实时数据湖教程-主键表更新机制

paimon实时数据湖教程-主键表更新机制

在上一章，我们学习了 Paimon 如何保证每一次写入的原子性和一致性。但数据仓库的核心需求不仅是写入，更重要的是更新。想象一个场景：我们需要实时更新用户的最新信息，或者实时累加计算用户的消费总额。传统的 Hive 数据湖对此无能…

阅读更多...

第十六届蓝桥杯青少组C++省赛[2025.8.9]第二部分编程题（4、矩阵圈层交错旋转）

第十六届蓝桥杯青少组C++省赛[2025.8.9]第二部分编程题（4、矩阵圈层交错旋转）

参考程序：#include <bits/stdc.h> using namespace std;const int MAXN 105; int a[MAXN][MAXN];int main() {int n;if (!(cin >> n)) return 0;for (int i 0; i < n; i)for (int j 0; j < n; j)cin >> a[i][j];int layers n / 2; // 每…

阅读更多...

【FastGTP✨】[01] 使用 FastGPT 搭建简易 AI 应用

【FastGTP✨】[01] 使用 FastGPT 搭建简易 AI 应用

简易应用：英语单词解释例句 1. 前言 FastGPT 是一个低代码 AI 应用构建平台，可以通过简单配置快速创建自己的 AI 应用。本文将带你用 FastGPT 搭建一个英语单词解释例句的 AI 工具，输入英文单词后，输出： 单词…

阅读更多...

【Mysql语句练习】

【Mysql语句练习】

MysqlMysql语句练习一、建库建表二、插入数据三、查询Mysql语句练习一、建库建表 1、创建数据库mydb11_stu，并使用数据库 # 创建数据库mydb11_stu mysql> create database mydb11_stu; Query OK, 1 row affected (0.00 sec) # 使用数据库 mysql> use mydb1…

阅读更多...

用Python Scrapy征服网络爬虫（反爬技术深入剖析）

用Python Scrapy征服网络爬虫（反爬技术深入剖析）

目录第1章：Scrapy是个啥？为什么它是你爬虫路上的最佳拍档？ 1.1 Scrapy的核心亮点 1.2 啥时候用Scrapy？ 1.3 安装Scrapy 第2章：动手写你的第一个Scrapy爬虫 2.1 创建Scrapy项目 2.2 定义数据结构（Items） 2.3 编写爬虫逻辑 2.4 运行爬虫 2.5 小技巧：调试爬虫 …

阅读更多...

解决Electron透明窗口点击不影响其他应用

解决Electron透明窗口点击不影响其他应用

遇到的问题：在electron透明窗口点击，影响窗口下的应用接受不到点击事件解决方案：CSSIgnoreMouseEvents实现原理：主进程默认设置禁用目标窗口鼠标事件（禁用之后能检测到mousemove），UI进程检测页面…

阅读更多...

C# 泛型（Generics）详解

C# 泛型（Generics）详解

泛型是 C# 2.0 引入的核心特性，它允许在定义类、接口、方法、委托等时使用未指定的类型参数，在使用时再指定具体类型。这种机制可以显著提高代码的复用性、类型安全性和性能。一、泛型的核心概念类型参数化泛型允许将类型作为 "参数" 传递给类…

阅读更多...

Spring中存在两个相同的Bean是否会报错？

Spring中存在两个相同的Bean是否会报错？

第一种情况：使用XML的方式设置Bean，这种情况在Spring启动时就会报错，因为ID在Spring中是Bean的唯一标识，Spring容器在启动时会校验唯一性，一旦发现重复就会报错。但是如果是在两个不同的XML文件中定义两个相同的Bean&a…

阅读更多...

【新手入门】Android基础知识（一）：系统架构

【新手入门】Android基础知识（一）：系统架构

目录 Android 系统架构图 1. 应用 2. JAVA API 框架 3. 原生 C/C 库 4. Android 运行时（Android Runtime） 5. 硬件抽象层 (HAL) 6. Linux 内核参考资料 Android 系统架构图 Android底层内核空间以Linux Kernel作为基石，上层用户空…

阅读更多...

晶振电路的负载电容、电阻参数设计

晶振电路的负载电容、电阻参数设计

系列文章目录文章目录系列文章目录前言一、晶振主要参数二、有源与无源区别三、无源晶振四、有源晶振总结前言在硬件电路的设计中，晶振电路是必不可少的，它充当了整个电路心脏的作用。在这个晶振电路的设计中负载电容、电阻参数的选型是很重要的&…

阅读更多...

电脑上练打字用什么软件最好：10款打字软件评测

电脑上练打字用什么软件最好：10款打字软件评测

现在孩子们在电脑上练打字，软件一搜一大把，可好多家长和老师都犯愁：到底哪个管用？我带200多个小学生练过字，前前后后试了十款软件，今天就掏心窝子说说——有的看着花哨其实没用，有的专业是专业但…

阅读更多...

第五天～提取Arxml的模板信息

第五天～提取Arxml的模板信息

🌟 ARXML模板信息提取：解锁汽车软件的乐高魔法在汽车电子的世界里，AUTOSAR（汽车开放系统架构）如同无形的神经系统，而ARXML文件正是承载这套神经系统蓝图的数字载体。当工程师们需要批量创建或修改ECU（电子控制单元）配置时，模板信息提取便成为了一项至关重要的核心技…

阅读更多...

react+antd+vite自动引入组件、图标等

react+antd+vite自动引入组件、图标等

前言：react在使用antd的时候，也是需要每个组件都在界面上按需引入的，那能不能自动生成，按需使用呢？我们这里说一说这个。安装插件，组件按需引入unplugin-antd-resolverunplugin-auto-importnpm install unp…

阅读更多...

深度学习与遥感入门（六）｜轻量化 MobileNetV2 高光谱分类

深度学习与遥感入门（六）｜轻量化 MobileNetV2 高光谱分类

系列回顾： （一）CNN 基础：高光谱图像分类可视化全流程 （二）HybridNet（CNNTransformer）：提升全局感受野 （三）GCN 入门实战：基于光谱 KNN…

阅读更多...

最新文章