机器学习的工作流程

🌟 欢迎来到AI奇妙世界! 🌟

亲爱的开发者朋友们,大家好!👋

我是人工智能领域的探索者与分享者,很高兴在CSDN与你们相遇!🎉 在这里,我将持续输出AI前沿技术、实战案例、算法解析等内容,希望能和大家一起学习、交流、成长!💡

🔥 为什么关注AI?

人工智能正在重塑世界!🌍

🚀 深度学习让机器拥有“视觉”“听觉”
🤖 **大模型(如GPT、文心一言)**改变人机交互方式
📊 数据科学赋能商业决策
🏥 AI医疗助力精准诊断
🛒 智能推荐优化用户体验
无论你是AI新手👶,还是资深极客👨💻,这里都有适合你的内容!

📌 你将在这里看到什么?

✅ AI基础入门(Python、TensorFlow/PyTorch)
✅ 实战项目(图像识别、NLP、推荐系统)
✅ 论文解读(CVPR、NeurIPS最新研究)
✅ 行业动态(AI政策、大模型进展)
✅ 避坑指南(训练技巧、调参经验)

💬 期待与你互动!

📢 评论区随时交流,欢迎提问!
💌 私信开放,一起探讨技术难题!
🤝 关注我,AI学习路上不迷路!

最后,送上一句AI圈的经典名言:

“人工智能不会取代人类,但会用AI的人会取代不用AI的人。”

让我们一起拥抱AI时代,用代码改变未来!🚀

点击关注👉,开启AI之旅! 🔥🔥🔥

目录

一.什么是机器学习

二.机器学习的工作流程

三.解释上述流程的各步骤

1.获取数据

①获取到的数据种类

②数据中的名词

③数据类型的构成

④数据分割

2.数据基本处理

3.特征工程

①什么是特征工程?

②为什么需要特征工程?

③特征工程包含的内容(了解)

特征提取

特征预处理

特征降维

4.机器学习(模型训练)

5.模型评估

小结


一.什么是机器学习

机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。

 简单来说,计算机通过对新的数据进行分析,获得一个模型,通过这个模型,计算机就可以预测未知属性

二.机器学习的工作流程

机器学习工作流程总结: 

  1. 获取数据
  2. 数据基本处理
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估:①结果达到要求,则上线服务 / ②结果没达到要求,则重复上面的步骤

三.解释上述流程的各步骤

1.获取数据

①获取到的数据种类

  • 房屋价格:可能是小数,如105.5万

  • 电影数据:动作片/喜剧片等等

  • 人物分类:可以按是否戴帽子 / 手里是否拿东西等等,来进行分类,没有对错之分,只是分类角度不同

②数据中的名词

在数据集中一般:

  • 一行数据我们称为一个样本

  • 一列数据我们称为一个特征

  • 需要我们判断的列(如上图的电影类型),我们称为目标值
  • 有些数据有目标值,有些数据没有目标值

如下图,有的行就没有电影类型,有的就有。

③数据类型的构成

  • 数据类型一:特征值+目标值(目标值是连续的和离散的)
  • 数据类型二:只有特征值,没有目标值

④数据分割

  • 机器学习一般的数据集会分成两部分
    • 训练数据:用于训练,构建模型
    • 测试数据:在模型检验时使用,用于评估模型是否有效
  • 划分比例:
    • 训练集:70% ~ 80%
    • 测试集:30% ~ 20%

2.数据基本处理

        对数据进行缺失值、去除异常值等处理。

        举例:比如我们让一群人填写问卷调查,肯定有人会有部分项不填写(缺失值),或者年龄填写1000岁(异常值),这两种情况就需要进行处理。

3.特征工程

①什么是特征工程?

        特征工程是使用专业背景知识和技巧,对数据进行处理,使得特征能在机器学习算法上发挥更好的作用

        意义:会直接影响机器学习的效果。

        简单理解就是,进一步对数据进行处理。

        因为工程一般都很重要(比如盖楼工程),所以就表示提取数据的特征是一件很重要的事,因此叫做特征工程。

②为什么需要特征工程?

③特征工程包含的内容(了解)

  • 特征提取

将任意数据(如文本或图像),转换为可用于机器学习的数字特征。

  • 特征预处理

通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

  • 特征降维

指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程。

4.机器学习(模型训练)

单独讲,请见该合集中的【机器学习的算法有哪些?】文章。

机器学习的算法有哪些?-CSDN博客

5.模型评估

单独讲,请见该合集中的【模型评估的介绍】文章。

模型评估的介绍-CSDN博客

小结

以上就是本篇文章的全部内容,喜欢的话可以留个免费的关注呦~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/90849.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/90849.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聚类里面的一些相关概念介绍阐述

一、性能度量外部指标:聚类结果与某个“参考模型”进行比较;系数: ,其中的 表示样本是否属于某类簇; 指数:,其中 表示样本在两个聚类结果中都是同一类簇, 表示在其中一个聚类结果中…

mmap机制

先看这个 MMAP 机制通俗易懂-CSDN博客 一句话 **mmap(memory map)是操作系统提供的“把文件或设备直接映射到进程虚拟地址空间”的机制,Java 里对应 `MappedByteBuffer`。** --- ### 1. 技术本质 - 系统调用:`mmap()`(POSIX)、`CreateFileMapping`(Windows)。 …

嵌入式硬件篇---驱动板

制作 ESP32 驱动板的核心是 “搭建 ESP32 与外设之间的桥梁”—— 因为 ESP32 的 GPIO 引脚输出电流很小(最大 20mA),无法直接驱动大功率设备(如电机、继电器、电磁阀等),驱动板的作用就是放大电流 / 功率&…

UniappDay01

1.技术架构2.创建uniapp项目 通过HBuilderX创建 官网安装创建uniapp vue3项目安装uniapp vue3的编译器在工具栏启动微信小程序开启服务端口模拟器窗口分离和置顶 通过命令行创建 3.pages.json和tabbar案例 pages.json用来配置路由,导航栏,tabbar等页面类…

子空间投影,投影矩阵,最小二乘法

一、子空间投影 1.1 投影与误差向量b 在 向量a 上的投影即 a 上离 b 最近的点: paTbaTaa p \frac{a^T b}{a^Ta}a paTaaTb​a 我们记 误差 e b - p,显然误差e 和 a 是正交的。 1.2 投影矩阵向量b 在子空间S上的投影是S中离b 最近的向量p。 我们做如下推…

基于FPGA的SPI控制FLASH读写

基于FPGA的SPI控制FLASH读写 文章目录基于FPGA的SPI控制FLASH读写一、SPI简介二、FLASH_M25P16简介信号描述功能操作注意时序三、设计思路框图设计状态机设计四、上板验证1、读ID2、读数据3、扇区擦除写数据五、总结六、代码一、SPI简介 SPI是Serial Peripheral interface的缩…

Pytest 参数化进阶:掌握 parametrize 的多种用法

概述 在自动化测试中,@pytest.mark.parametrize 不仅仅能用来为测试函数提供多组输入数据,还能配合其他功能实现更复杂的测试逻辑。本文将带你深入了解 @pytest.mark.parametrize 的多种常见用法,助你在不同场景下写出更高效、更清晰的测试代码 基础用法回顾:单个参数化 …

K8S 九 安全认证 TLS

目录第九章 安全认证访问控制概述认证管理授权管理 RBACRBACRolerules中的参数RoleBinding9.4 准入控制其他K8S的TLS是什么(DeepSeek)1. 加密通信2. 身份认证(Authentication)3. 数据完整性K8s 中 TLS 的具体应用**1. API Server …

积分兑换小程序Java

某个学校为了激励学生踊跃参加一些社会实践活动,会对参与者给予一些校园积分,学生们获得校园积分后可以使用校园积分在指定的老师那兑换一些学习用具,当前可兑换的物品和对应的积分数量如下:铅笔1分橡皮2分作业本3分文具盒5分为了…

函数指针示例

使用函数指针来调用 printf。下面是对代码的详细解释&#xff1a;&#x1f4c4; 源代码解析#include <stdio.h>int main() {int (*myshow)(const char *, ...); // 声明一个函数指针&#xff0c;指向可变参数函数printf("hello world!\n");myshow printf; /…

不坑盒子突然不见了怎么办?

如果你安装后之前一切正常&#xff0c;突然某天在Office的功能区看不到不坑盒子了&#xff0c;这种是插件被禁用了&#xff0c;重装安装插件、Office都是不能解决的&#xff0c;必须按下面的方法解决。WPS中1.随便打开一个文档&#xff0c;点击文件-选项-信任中心&#xff0c;最…

Java面试全栈通关:从微服务到AI的技术深度解析

Java面试全栈通关&#xff1a;从微服务到AI的技术深度解析 面试现场&#xff1a;大厂技术终面室 面试官&#xff1a;谢飞机同学&#xff0c;今天我们将从基础到架构&#xff0c;全面考察你的Java技术栈掌握程度。请真实展示你的技术水平。 谢飞机&#xff1a;&#xff08;挺胸抬…

《Java 程序设计》第 7 章 - 继承与多态

引言在 Java 面向对象编程中&#xff0c;继承与多态是两大核心特性&#xff0c;它们共同支撑了代码的复用性、扩展性和灵活性。本章将从继承的基本实现开始&#xff0c;逐步深入到方法覆盖、访问控制、抽象类等概念&#xff0c;最终揭示多态的本质与应用。通过大量可运行的代码…

ksql连接数据库免输入密码交互

ksql连接数据库免输入密码交互1. 使用 .pgpass 文件&#xff08;推荐&#xff09;2. 使用环境变量3. 使用连接字符串4. 修改 ksql 的别名&#xff08;简化命令&#xff09;5. 注意事项6. 密码含特殊字符转义在 Kingbase 中使用 ksql 连接数据库时&#xff0c;如果希望避免每次手…

UniApp H5 适配 PC 端新姿势:打造跨设备一致体验

在移动互联网蓬勃发展的今天&#xff0c;很多开发者会选择使用 UniApp 来开发多端应用&#xff0c;尤其是 H5 端&#xff0c;因其无需下载安装即可访问的特性&#xff0c;深受用户喜爱。但 UniApp H5 应用在 PC 端直接打开时&#xff0c;往往会因为屏幕尺寸的巨大差异&#xff…

【MySQL#4】函数 复合查询 内外连接

&#x1f4c3;个人主页&#xff1a;island1314 ⛺️ 欢迎关注&#xff1a;&#x1f44d;点赞 &#x1f442;&#x1f3fd;留言 &#x1f60d;收藏 &#x1f49e; &#x1f49e; &#x1f49e; 生活总是不会一帆风顺&#xff0c;前进的道路也不会永远一马平川&#xff0c;如何面…

C++常见面试题之一

一、语言基础与内存管理const与constexpr的区别&#xff1f;应用场景&#xff1f; const&#xff1a;运行时常量&#xff0c;修饰变量/函数不可修改。constexpr&#xff1a;编译期常量&#xff08;C11&#xff09;&#xff0c;用于优化计算&#xff08;如数组大小&#xff09;。…

Golang 语言中的指针介绍

介绍&#xff1a;指针式一种数据类型&#xff0c;用来存储值的内存地址&#xff0c;为了便于理解&#xff0c;我们也可以把指针未内存地址&#xff0c;指针类型只占用内存4个或 8 个字节&#xff0c;在Golang 语言中&#xff0c;类型名称加 * 表示改类型的指针类型。指针类型变…

Flink 状态管理设计详解:StateBackend、State、RocksDB和Namespace

为什么需要 StateBackend&#xff1f;—— 职责分离原则我们可以用一个银行的例子来类比&#xff1a;State (如 ValueState, ListState) 就像是你的银行卡。AbstractKeyedStateBackend 就像是银行的整个后台系统&#xff08;包括总服务器、数据库、风控系统、会计系统等&#x…

橱柜铰链的革命:炬森精密如何以创新科技重塑家居体验

在现代化家居设计中&#xff0c;橱柜不仅是存储空间的核心&#xff0c;更是生活品质的象征。而作为橱柜的“关节”&#xff0c;橱柜铰链的性能直接影响着日常使用的便捷性、安全性和耐久性。然而&#xff0c;许多消费者在橱柜使用中常遭遇噪音干扰、频繁松动或早期损坏等痛点&a…