1-机器学习与大模型开发数学教程-第0章 预备知识-0-1 集合与逻辑基础(集合运算、命题逻辑、量词)

在正式进入机器学习与大模型的数学核心之前,我们需要先打好“语言”和“逻辑”的基础。
这一章会从 集合与逻辑 入手,它们就像是编程中的语法规则:

  • 集合告诉我们“对象属于不属于某个范围”;
  • 逻辑告诉我们“命题对不对、能不能推出新的结论”。

这些看似抽象的概念,在 AI 里非常重要:神经网络的输入数据本质上就是集合的元素,训练过程中的条件判断与优化也依赖逻辑和推理。


0-1 集合与逻辑基础

集合运算

集合是什么?
集合(Set)就是一堆对象的“容器”。

  • 数学里:集合 A=1,2,3A = {1, 2, 3}A=1,2,3
  • 生活里:水果篮子 = {苹果,香蕉,橘子}

集合的运算很直观:

  1. 并集(Union):把两个篮子的水果合并,去重。
    A∪BA \cup BAB = 属于 AAA 或属于 BBB 的元素。
  2. 交集(Intersection):两个篮子里都有的水果。
    A∩BA \cap BAB = 同时属于 AAABBB 的元素。
  3. 差集(Difference):只在 AAA,不在 BBB
    A∖BA \setminus BAB = 属于 AAA 但不属于 BBB 的元素。
集合 A
并集
集合 B
交集
差集 A-B

图示说明:上图表示集合 AAABBB 的三种常见运算:并集、交集和差集。

在机器学习中的例子

  • 训练数据集(Train)与测试数据集(Test)不能有交集,否则会导致“作弊式”高准确率。
  • 语料库的去重就是在做集合运算(去掉重复的句子 = 差集)。

命题逻辑

命题是什么?
命题(Proposition)就是一句 有真假值 的陈述。

  • “明天会下雨” ✅ (要么真要么假)
  • “你吃饭了吗?” ❌ (没有真假值,不是命题)

命题之间可以组合运算:

  1. 否定(NOT):如果 PPP 是“明天会下雨”,那 ¬P\neg P¬P 就是“明天不会下雨”。
  2. 合取(AND)P∧QP \land QPQ 表示“明天下雨 并且 我带伞”。
  3. 析取(OR)P∨QP \lor QPQ 表示“明天下雨 或者 我带伞”。
  4. 蕴含(Implication)P⇒QP \Rightarrow QPQ 表示“如果明天下雨,那么我会带伞”。
命题 P: 明天下雨
命题 Q: 我带伞
P AND Q
P OR Q
如果 P 那么 Q

图示说明:命题 PPPQQQ 可以通过逻辑运算组合成新命题。

在机器学习中的例子

  • 决策树 就是命题逻辑的“机械版”。例如:
    • 如果(身高 > 1.8m)并且(体重 > 80kg),那么分类为“篮球运动员”。
  • 神经网络激活条件 也可以看作逻辑的“模糊版”:ReLU 就像是“如果大于0则输出,否则为0”。

量词

量词 是在命题逻辑的基础上,表示范围的工具。常见的有:

  1. 全称量词(∀,for all)
    • “对于所有学生,都要考试”
    • 数学符号:∀x,;P(x)\forall x, ; P(x)x,;P(x)
    • 机器学习例子:∀\forall 样本 xxx,我们都希望模型能预测正确。
  2. 存在量词(∃,there exists)
    • “有些人喜欢咖啡”
    • 数学符号:∃x,;P(x)\exists x, ; P(x)x,;P(x)
    • 机器学习例子:∃\exists 一些超参数配置能让模型收敛。
全称量词 ∀x
命题 P(x)
存在量词 ∃x

图示说明:量词规定了命题作用的范围,全称量词要求“所有情况”,存在量词只要求“至少一个”。

在机器学习中的例子

  • 在验证模型时:
    • 全称量词:理想情况是“∀ 测试样本,预测正确”。
    • 存在量词:现实情况是“∃ 一些样本被错误分类”。

小结

  • 集合:帮助我们组织数据,避免数据泄露或混淆。
  • 命题逻辑:是条件判断和推理的基石,决策树、规则模型都离不开它。
  • 量词:为逻辑加上范围,用来表达“全部成立”还是“存在某些例外”。

联系 AI 的意义
集合与逻辑是机器学习数学的“语法”。理解这些,就能更自然地看懂模型定义(输入集合、输出集合)、损失函数约束(逻辑条件)、以及训练目标(全称 vs 存在)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/98890.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/98890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

字节 Trae vs 腾讯 CodeBuddy vs 阿里 Qoder:三大 AI-IDE 集成 OneCode 深度对比与体验测评

一、对比背景:AI-IDE 与低代码融合的行业必然性 在低代码开发进入 “AI 赋能期” 的 2025 年,AI 驱动的集成开发环境(AI-IDE)已成为低代码平台效率提升的核心载体。全球 AI-IDE 市场规模突破 50 亿美元,年增长率超 70…

DeerFlow 与 MCP 区别深度解析

目录 引言 一、DeerFlow 与 MCP 的详细概念说明 1. DeerFlow:面向研究自动化的多智能体应用框架 2. MCP:连接 AI 模型与外部系统的标准化通信协议 二、核心定位:应用框架与通信协议的本质 1. 角色不同 2. 技术架构 三、功能特性&…

视觉对象类型

矩形类型 对于最基本的视觉效果,Qt Quick 提供了一种绘制矩形的类型。这些矩形可以用颜色或垂直渐变着色。该类型还可以在矩形上绘制边框。 若要绘制矩形以外的自定义形状,请参阅类型或使用该类型显示预渲染图像。 import QtQuickItem {width: 320h

排序---选择排序(Selection Sort)

一、选择排序的基本概念 选择排序(Selection Sort)是一种简单直观的排序算法,其核心思想是每次从待排序元素中找到最值(最小值或最大值),将其放到已排序序列的末尾,重复此过程直到所有元素完成排…

前端菜单权限方案

方案一:前端全量配置路由表 后端返回权限码思路所有可能的路由都在前端 router 中静态配置好(就像你现在这样)。登录后,后端返回当前用户的菜单权限(通常是一个权限 code 列表)。前端根据权限码过滤掉无权…

spring项目部署后为什么会生成 logback-spring.xml文件

以下内容为豆包生成,此处仅做记录在 Spring 项目(尤其是 Spring Boot 项目)部署后生成 logback-spring.xml 文件,通常有以下几种原因:1. 项目打包时主动包含了该文件logback-spring.xml 是 Logback 日志框架在 Spring …

如何解决pip安装报错ModuleNotFoundError: No module named ‘vaex’问题

【Python系列Bug修复PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘vaex’问题 摘要 在Python开发过程中,使用pip install时遇到错误是非常常见的情况。特别是在使用PyCharm等集成开发环境(IDE&#xff0…

实习总结——关于联调解决的因CRC校验导致协议交互失败的调试经验总结

1.场景还原:在我开发USB PD测试模块时,发现待测主板始终不回复Request消息,导致我的测试失败;此时我的任务就是快速定位这个协议交互失败的原因,无论是软件、硬件还是协同。2.大致的调试步骤:1.首先使用了逻…

STM32之RTC

RTC简介 实时时钟(Real Time Clock,RTC),本质是一个计数器,计数频率常为秒,专门用来记录时间。 普通定时器拿来作时钟可行吗?普通定时器无法掉电运行! RTC特性: 1,能提供时间&…

【OC】单例模式

文章目录前言概念优缺点优点缺点两种使用模式懒汉模式实现代码运行结果饿汉模式实现代码运行结果在自定义类方法时的几种常见写法总结前言 在之前我们已经学习过单例模式的有关内容,但是只是最简单的单例,无法胜任多线程或者稍微多一点的情况便无法确定…

机器学习(七)决策树-分类

一 概念1 决策节点通过条件判断而进行分支选择的节点。将样本的属性值,也就是特征值与决策节点上的值进行比较,从而判断它的流向。2 叶子节点没有子节点的节点,表示最终的决策结果。3 决策树的深度所有节点的最大层次数决策树具有一定的层次结…

IT 服务管理的新格局:从工单系统到一体化 ITSM 平台

企业 IT 部门的角色转变在过去,IT 部门更多被视为“技术支持”,主要负责设备维护和故障处理。但随着数字化转型加速,IT 已经成为业务连续性和创新的重要推动力。从客户体验到数据安全,从业务敏捷到成本控制,IT 服务管理…

创建一个Spring Boot Starter风格的Basic认证SDK

文章目录前言设计思路SDK实现步骤1. 创建SDK Maven项目(sdk目录)2. 实现配置类3. 实现认证逻辑4. 实现拦截器5. 实现自动配置6. 创建spring.factories文件使用方集成步骤1. 引入SDK依赖2. 配置Application属性3. 创建测试接口4. 测试接口访问SDK扩展功能…

mybatis处理统计sql进度丢失问题

如何处理统计sql进度丢失 SELECT sum(decimal_column) AS sum_value FROM your_table如上sql执行时没有问题,在数据库可视工具可以正常显示,但是在mybatis执行时,却出现解决办法 使用转 decimal 控制精度 SELECT CAST(SUM(decimal_column) A…

全球首款!科聪控制器获德国 TÜV 莱茵功能安全认证

近日,浙江科聪控制技术有限公司(以下简称"科聪")的安全移动机器人控制器MSC5000荣获全球权威认证机构德国莱茵TV集团(TV Rheinland)颁发的功能安全认证证书。这款控制器是全球首款通过SIL3、PLe 认证的移动机…

pureadmin的动态路由和静态路由

在 PureAdmin(基于 Vue3 的后台管理框架)中,静态路由和动态路由是实现路由管理的两种方式,主要区别在于路由的定义时机、加载方式和灵活性,具体区别如下: 1. 静态路由 定义方式:路由规则在代码中…

第3章:CPU实战

1. Linux操作系统CPU平均负载 以前我们总认为CPU使用率和CPU平均负载是一样的,负载高了就是CPU使用率提高。但是到底是什么情况呢? 1.1. CPU的平均负载 单位时间内 系统处于 可运行状态 和不可中断状态 的平均进程数,就是平均活跃进程数&a…

【Vue3】06-利用setup编写vue(1)

其它篇章: 1.【Vue3】01-创建Vue3工程 2.【Vue3】02-Vue3工程目录分析 3.【Vue3】03-编写app组件——src 4.【Vue3】04-编写vue实现一个简单效果 5.【Vue3】05-Options API和Composition API的区别 6.【Vue3】06-利用setup编写vue(1) 7.【Vue…

UDS NRC速查

目录 NRC 一、通用NRC(0x10~0x5F) 二、数据相关NRC(0x70~0x8F) 三、会话与状态NRC 注意事项 UDS中的NRC(Negative Response Code)即否定响应码,用于在诊断通信中表示服务端无法成功执行客户端请求的原因。以下是一些常用的UDS NRC码及其含义: HEX Name Description 01 …

【AI论文】多模态大型语言模型的视觉表征对齐

摘要:通过视觉指令微调训练的多模态大型语言模型(MLLMs)在各类任务中均取得了优异表现,然而在以视觉为中心的任务(如物体计数或空间推理)中,其性能仍存在局限。我们将这一差距归因于当前主流的纯…