【橘子的AI | 每日一课】Day4!机器学习 (ML) 基础

机器学习 (ML) 基础介绍

一、机器学习的定义

从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导 “预测”。

机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。可以把机器学习的过程与人类对历史经验归纳的过程做个比对,人类在成长、生活过程中积累了很多的历史与经验,定期地对这些经验进行“归纳”,获得了生活的“规律”,当人类遇到未知的问题或者需要对未来进行“推测”的时候,人类使用这些“规律”,对未知问题与未来进行“推测”,从而指导自己的生活和工作。机器学习中的“训练”与“预测”过程可以对应到人类的“归纳”和“推测”过程。

二、机器学习的核心思想

机器学习的核心思想可以从以下几个方面来理解:

  1. 数据驱动:机器学习依赖于大量的数据,就像人们通过阅读书籍来学习知识一样,机器学习通过分析数据来学习规律。
  2. 模式识别:其目标是识别数据中的模式,比如,通过分析大量猫的图片,机器可以学会识别猫的特征。
  3. 算法优化:使用各种算法来处理数据,这些算法会不断优化以更好地从数据中学习,就像人们通过不断练习来提高技能一样。
  4. 预测与决策:学习到的模式可以用于预测和决策,比如,一个天气预报模型可以预测明天的天气。
  5. 自适应性:机器学习模型可以随着新数据的输入而不断更新和改进,这就像人们根据新信息调整自己的观点和决策。
  6. 泛化能力:好的机器学习模型不仅能在训练数据上表现良好,还能泛化到未见过的数据上,这就像是学会了骑自行车的人,即使换了一辆不同的自行车也能骑得很好。
  7. 自动化:可以自动化许多任务,比如自动化邮件分类、语音识别等,这大大提升了效率。

机器学习核心思想

三、机器学习与AI的关系

人工智能(AI)是一个更广泛的领域,涵盖了让机器表现出类似于人类智能的各种技术和方法,而机器学习是实现人工智能的一种具体方法和技术,是人工智能的一个子领域。人工智能的目标是使机器能够模拟人的认知功能,甚至超越人类在某些任务中的表现,其应用领域非常广泛,包括自然语言处理、计算机视觉、专家系统、机器人控制等。而机器学习主要专注于如何让计算机自动从数据中学习和优化。

简单来说,机器学习是实现人工智能的一种方式,属于人工智能的一个分支。人工智能不仅仅包括机器学习,还涵盖了知识表示、推理、规划等其他技术。

机器学习与AI的关系

四、机器学习的三种主要范式

(一)监督学习

监督学习是一种基于已标记数据进行训练的学习方式。在训练过程中,算法会接受输入数据及其对应的标签(或者称为输出),以此来学习输入和输出之间的关系,其主要目的是找到一个从输入到输出的映射函数,使得模型能够对新数据进行预测。监督学习可以进一步分为分类和回归:

  1. 分类:将输入分配到离散的类别中,例如垃圾邮件检测、图像分类等。
  2. 回归:预测连续的数值输出,例如预测房价、股票价格等。

常见的监督学习算法包括线性回归、逻辑回归、决策树、随机森林、支持向量机等。以房价预测为例,使用线性回归模型,通过分析房屋的面积、房间数量、地理位置等特征数据,以及对应的房价标签,训练出一个预测模型,当有新的房屋数据输入时,就可以使用该模型预测其房价。

(二)无监督学习

与监督学习不同,无监督学习是在没有标签的数据集上进行训练的学习方式,其主要目的是发现数据中的结构、模式、或者隐藏的关系,更加关注数据的内部相似性和聚集特征,通常用于数据探索和降维。无监督学习主要包括聚类和降维:

  1. 聚类:将相似的数据点归为一类,例如客户细分、文档分类等。
  2. 降维:将高维数据投射到低维空间,以便于可视化和处理,例如主成分分析(PCA)。

常见的无监督学习算法有K均值聚类、层次聚类、主成分分析(PCA)、自编码器等。例如在市场营销中,根据客户的购买历史、浏览行为等特征数据,使用无监督学习算法进行聚类分析,可以将客户分为不同的群体,企业可以针对不同群体制定个性化的营销策略。

机器学习无监督学习

(三)强化学习

强化学习是一种使智能体(agent)通过与环境(environment)交互,学习如何采取行动以最大化累积奖励(cumulative reward)的机器学习方法。与监督学习和无监督学习不同,强化学习更注重序列决策和长期回报的优化。

强化学习系统通常包括智能体、环境、状态、动作、奖励、策略、价值函数、Q值等基本组成部分。智能体在每一步都要从环境中接收状态,选择动作,并根据环境的反馈更新策略,这个过程通常被建模为马尔可夫决策过程(MDP)。

常见的强化学习算法有Q学习、深度Q网络(DQN)等。以游戏为例,智能体就像是游戏玩家,环境就是游戏世界,游戏中的各种场景和角色状态就是状态,玩家可以采取的操作(如移动、攻击、跳跃等)就是动作,当玩家完成一个任务或击败一个敌人时,游戏会给予一定的分数奖励,这就是奖励,玩家通过不断地尝试不同的操作,根据获得的分数来学习如何在游戏中取得更高的分数,即最大化长期累积奖励。

机器学习强化学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85503.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85503.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C语言】药店药品管理系统 -丨完整源码与实现解析

系统概述 这是一个功能完善的药店药品管理系统,使用C语言开发,基于链表数据结构实现。系统提供药品信息的增删改查、排序和持久化存储功能,适用于药店日常药品管理工作。 数据结构设计 #define MAX_NAME_LEN 50 #define MAX_ID_LEN 20 #de…

sass-loader与webpack版本冲突解决方案

#npm i 错误解决记录# 最开始错误 :拉取代码,增加依赖时,报错 问题: 在安装sass-loader10.1.1时,发现与现有的webpack版本有冲突。 当前项目已经安装了webpack4.28.4(通过peer dependency requirements f…

常见误区解读之三:超融合只适合外围/轻量业务场景,无法承载数据库等关键业务?

作者:SmartX 金融团队 祝志刚 在前两期“超融合常见误区解读”中,我们分别解读了如何以超融合建云并进行大规模部署。而对于生产业务场景,部分行业用户和业界人士可能还会有这样的认知: “超融合管理简单、成本也低,…

Kafka重平衡机制深度解析:原理、触发条件与应对策略

引言 在Kafka分布式消息系统中,重平衡(Rebalance)是一个至关重要的机制,它确保消费者组中的各个消费者实例能够公平地分担主题分区的消费任务。然而,重平衡过程也可能带来短暂的消费停顿和性能波动,处理不…

使用 Docker Compose 安装 Milvus(单机版)

1. 创建专用目录并进入 mkdir milvus-standalone && cd milvus-standalone 2. 下载 docker-compose.yml 文件 使用官方提供的配置文件(以 Milvus v2.3.3 为例): wget https://github.com/milvus-io/milvus/releases/download/v2.3…

【MySQL篇05】:事务的 ACID 性(数据库原理篇)

文章目录 一、事务的ACID特性二、数据库原理例题与 ACID 特性判断三、拓展(undolog 与 redolog) 一、事务的ACID特性 综述: 原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功&…

crawl4ai 框架的入门讲解和实战指南——基于Python的智能爬虫框架,集成AI(如NLP/OCR)实现自动化数据采集与处理

一、crawl4ai 框架简介 1. 框架定位 核心功能:基于Python的智能爬虫框架,集成AI(如NLP/OCR)实现自动化数据采集与处理 关键特性: 零配置快速启动(自动识别网页结构) 内置反反爬机制&#xff…

受够垃圾翻译!CodeBuddy 8 分钟造神器,划词秒翻 + 自动适配所有网页

本文所使用的 CodeBuddy 免费下载链接:腾讯云代码助手 CodeBuddy - AI 时代的智能编程伙伴 前言 作为一个天天泡在 GitHub 上扒项目的人,翻译问题简直是我 “挖宝” 路上的头号绊脚石!想研究国外大神的优质开源项目,不是被机翻软…

零基础设计模式——总结与进阶 - 2. 反模式

第五部分:总结与进阶 - 2. 反模式 (Anti-Patterns) 在软件开发中,我们追求良好的设计模式以构建健壮、可维护的系统。然而,同样存在一些常见的、导致不良后果的解决方案,这些被称为“反模式”。理解反模式,可以帮助我…

音视频流媒体高级开发-学习路线

原文作者:Linux 原文链接:音视频流媒体高级开发-学习路线 如果你想往音视频方向发展,那么本文一定要认真阅读~ 大家都知道音视频开发薪资高、门槛高、发展空间大,心里蠢蠢欲动,却不知道怎么入门,怎么进阶…

LINUX 通过rsync同步 免密备份

1,增加免密码用户密码 useradd backup echo "5566777" | passwd --stdin backup echo "backup ALL(ALL) ALL" >> /etc/sudoers # 源服务器操作 ssh client_usersource_server ssh-keygen -t rsa # 一路回车 ssh-copy-id serv…

在使用 HTML5 的 <video> 标签嵌入视频时,有时会遇到无法播放 MP4 文件的问题

原因分析: 只能播放声音,却无法播放视频。这通常是由于视频编码格式不兼容导致的。虽然 MP4 是一种常见的视频格式,但它包含多种编码方式,并非所有编码方式都受 HTML5 支持。 解决方案: 确认视频编码格式: …

【bugfix】记一次Spring Boot 配置层级错误导致数据库连接失败

前言:为什么你的数据库配置读不到? 在 Spring Boot 项目中,配置文件的层级(prefix) 是决定属性能否被正确解析的核心因素。一个看似微小的缩进错误,可能导致整个应用的数据库连接失败、服务启动异常&#…

wpf 队列(Queue)在视觉树迭代查找中的作用分析

文章目录 队列(Queue)在视觉树迭代查找中的作用分析示例代码一、队列的核心作用1. 替代递归的迭代机制2. 实现广度优先搜索(BFS) 二、队列的工作流程1. 初始化阶段2. 处理循环 三、队列操作的详细步骤查找过程分解: 四、为什么使用队列而不是其他数据结构1. 与栈(St…

快手数据开发面试SQL题:取窗口内排名第一和排名倒数第一的作为两个字段输出

目录 问题描述 样例数据表 sales 解决方案 第三步:使用条件聚合将多行合并为单行输出" 步骤1:计算排名的中间结果 中间结果输出: 步骤2:最终查询(处理并列情况) 最终输出结果: 关键点解释: RANK() OVER (PARTITION BY group_id ORDER BY amount DESC):…

第十六届蓝桥杯国赛(2025)C/C++B组 蓝桥星数字 独家解析

这题我中午是12点以后开始做的,只剩下1个小时了,12点50的时候完成了框架,但是细节总是实现不对,现在晚上来复盘的时候才把这题A出来了。 但是,就像高考的导数你整个思路都会,你死在了求导上。。。&#xf…

Google 的 Protocol Buffers 介绍

Protocol Buffers(简称 Protobuf)是由 Google 开发的一种高效、灵活、跨语言的数据序列化协议,广泛用于网络通信、分布式系统、持久化存储等场景。 一、什么是 Protocol Buffers? Protocol Buffers 是一种结构化的数据交换格式,类似于 XML 和 JSON,但更小、更快、更简单…

犀思云Fusion WAN与阿里云NIS深度融合,实现端到端智能可观测

随着“AI数智化”浪潮逐步深入行业,企业网络的复杂与故障感知日渐凸显。如何实现网络的高效运维、智能诊断与全域可视化管理,已成为企业上云的核心挑战。 近日,犀思云与阿里云达成深度产品级合作,将阿里云网络智能服务&#xff0…

基于gec6818的环境监测系统设计

一、设计要求 将环境中温湿度数值、环境的光照强度和烟雾的信息获取到开发板,显示在图形界面上。当温度值高于阈值时,温度指示灯变红、蜂鸣器告警并且启动直流电机正转降温;当湿度值高于阈值时,湿度指示灯变红、蜂鸣器告警并且继电器吸合接通…

c++中std::transform详解和应用代码示例

std::transform 是 C 标准库中非常常用的算法之一&#xff0c;属于 <algorithm> 头文件。它的作用是将一个&#xff08;或两个&#xff09;序列中的元素通过某个函数进行变换&#xff0c;并将结果输出到另一个序列中。 一、std::transform 作用总结 std::transform 支持…