【数据库干货】六大范式速记

1NF2NF3NFBCNF4NF5NF都是数据库设计中的范式(Normalization),用于确保数据库中的数据结构尽可能地减少冗余,避免更新异常、插入异常、删除异常等问题,从而提高数据的存储效率和一致性。
本篇文章简单讲解下各个范式的含义,以及如何快速记住它们。

1. 第一范式(1NF)

定义:一个关系(表)满足第一范式,意味着表中的每个字段(列)都必须是原子的(atomic)。即每个字段只能包含一个单一的值,而不能是集合、数组或多值。
通俗来说:数据表的每个单元格只能存储一个值,不能有重复的组或多值字段。
问题:如果数据表不满足1NF,可能存在列包含多个值的情况,比如一个列存储多个电话号码。
例子: 假设有一个“学生课程”表,记录学生选修的课程。初始状态可能是这样的:

学生ID学生姓名选修课程
1张三数学, 英语
2李四物理, 化学

这个表不符合1NF,因为“选修课程”列包含多个值。为满足1NF,我们需要将每个学生的每一门课程分开:

学生ID学生姓名选修课程
1张三数学
1张三英语
2李四物理
2李四化学

这样,每个字段都是原子的。

2. 第二范式(2NF)

定义:一个关系(表)满足第二范式,首先它必须满足第一范式,并且所有非主属性(即不是主键的属性)完全依赖于主键,而不是部分依赖。也就是说,如果主键是由多个列组成的,那么非主属性必须依赖于整个主键,而不能只依赖于主键的某一部分。
通俗来说:如果主键是复合主键(由多个字段组成),那么每个非主键字段必须依赖于整个主键,而不能只依赖其中的一部分。
问题:如果存在部分依赖,就可能会导致冗余数据。例如,一个复合主键的表中,如果有字段只依赖于主键的一部分,那么这些字段的重复值就会导致数据冗余。
例子: 继续考虑“学生课程”表,如果我们加入“教师姓名”字段,这样的表结构如下:

学生ID课程ID学生姓名选修课程教师姓名
1101张三数学王老师
1102张三英语李老师
2101李四物理王老师
2103李四化学张老师

主键是“学生ID”和“课程ID”的组合。在这个例子中,学生姓名和教师姓名都依赖于学生ID和课程ID,但学生姓名只依赖于学生ID,而教师姓名只依赖于课程ID。因此,我们存在部分依赖,表不满足2NF。
为满足2NF,我们应该将“学生姓名”单独提取到一个“学生”表中,将“教师姓名”提取到一个“课程”表中:
学生表:

学生ID学生姓名
1张三
2李四

课程表:

课程ID选修课程教师姓名
101数学王老师
102英语李老师
103化学张老师

学生选课表:

学生ID课程ID
1101
1102
2101
2103

这样就解决了部分依赖问题,表满足了2NF。

3. 第三范式(3NF)

定义:一个关系(表)满足第三范式,首先它必须满足第二范式,并且每个非主属性都不传递依赖于主键。也就是说,非主键字段不能依赖于其他非主键字段。
通俗来说:如果一个字段依赖于其他非主键字段,那么我们就有传递依赖。3NF要求消除这种依赖。
问题:传递依赖可能会导致冗余数据和数据一致性问题。
例子: 假设我们在“课程表”中添加了“课程时长”字段,并且规定“教师姓名”依赖于“教师工号”,即:

课程ID选修课程教师工号教师姓名课程时长
101数学1王老师40小时
102英语2李老师35小时
103化学3张老师50小时

在这个表中,“教师姓名”依赖于“教师工号”,而“教师工号”又依赖于主键(课程ID)。因此,“教师姓名”通过“教师工号”传递依赖于课程ID。为了消除这种传递依赖,我们需要将“教师工号”和“教师姓名”提取到单独的“教师”表中:
教师表:

教师工号教师姓名
1王老师
2李老师
3张老师

这样就消除了传递依赖,表满足了3NF。

4. 巴斯-科德范式(BCNF)

定义:
一个表满足 BCNF(Boyce-Codd Normal Form)要求满足以下条件:

  1. 必须满足 3NF。
  2. 对于每一个函数依赖(A → B),A 必须是候选键(candidate key)。也就是说,任何决定其他属性的字段都必须是候选键。
    通俗来说:
  • 在 3NF 中,我们要求没有传递依赖,而 BCNF 要求每个决定其他字段的字段,必须是候选键。
  • 候选键 是指在没有其他列可以作为键的情况下,可以唯一标识表中一行的列。

为什么需要 BCNF?

3NF 有时不能处理一些更复杂的依赖关系,特别是当表中的某些非主属性决定了其他非主属性时,虽然这些属性满足了3NF,但却不能保证表的完美规范化。
BCNF 示例:
假设我们有以下表格,记录了课程、学生、教师和教室的信息:

课程ID学生ID教师工号教师姓名教室
10111王老师A101
10121王老师A101
10212李老师B201
10232李老师B201
  • 假设 课程ID → 教室(即每门课程对应一个教室),教师工号 → 教师姓名(即每个教师工号对应一个教师姓名),课程ID → 教师工号(即每门课程由一个特定的教师授课)。
    依赖关系:

    • 课程ID → 教室
    • 课程ID → 教师工号
    • 教师工号 → 教师姓名

    从上面的表格来看,我们发现 课程ID 确定了 教室 和 教师工号,但 教师工号 又决定了 教师姓名。这意味着 教师姓名 是由 教师工号 确定的,而 教师工号 不是候选键。教师工号 → 教师姓名 的依赖关系违反了 BCNF,因为 教师工号 不是候选键。

    解决方案:
    为了使表符合 BCNF,我们需要将表拆分为两个表:
    1. 课程表:包含课程和教室的信息。
    2. 教师表:包含教师工号和教师姓名的信息。
    3. 选课表:包含学生ID、课程ID和教师工号的信息。

    拆分后的表:

    • 课程表:

      课程ID教室
      101A101
      102B201
    • 教师表:

      教师工号教师姓名
      1王老师
      2李老师
    • 选课表:

      学生ID课程ID教师工号
      11011
      21011
      11022
      31022

通过拆分,教师工号 → 教师姓名 的依赖关系被转移到 教师表,而不再出现在原始的表中,从而使表符合 BCNF。

5. 第四范式(4NF)

定义:
一个表满足 第四范式(4NF),要求:

  1. 必须满足 BCNF。
  2. 表中不存在多值依赖(multivalued dependency)。

多值依赖 是指一个属性集决定了两个或多个其他属性集,但这些属性集之间没有关系。例如,一个学生可以同时选修多门课程,并且每个学生有多个兴趣爱好,这就构成了多值依赖。
通俗来说:

  • 如果一个表中存在两组不相关的多值依赖关系,那么表就不符合 4NF。
  • 4NF 的目的是消除由于多值依赖引起的数据冗余。

4NF 示例:
假设有一个表记录了学生的选修课程和兴趣爱好:

学生ID选修课程兴趣爱好
1数学篮球
1英语游泳
2物理篮球

在这个表中,学生ID 可以决定 选修课程 和 兴趣爱好,但这两个属性集是独立的,即学生选修课程与学生兴趣爱好之间没有直接关系。因此,表格存在 多值依赖,这是不符合 4NF 的。

解决方案:
为了满足 4NF,我们需要将表拆分为两个表:

  1. 一个记录学生和选修课程的表。
  2. 一个记录学生和兴趣爱好的表。

拆分后的表:

  • 学生课程表:

    学生ID选修课程
    1数学
    1英语
    2物理
  • 学生兴趣表:

    学生ID兴趣爱好
    1篮球
    1游泳
    2篮球

这样,两个独立的多值依赖关系被拆分到不同的表中,消除了冗余数据,符合 4NF。

6. 第五范式(5NF)

定义:
一个表满足 第五范式(5NF),要求:

  1. 必须满足 4NF。
  2. 表中不存在任何连接依赖(join dependency)。

连接依赖 是指表中的某些数据不能通过简单的连接来表示,而是需要一些特殊的处理逻辑来恢复数据。这通常发生在多对多关系中的某些复杂数据模式下。

通俗来说:

  • 5NF 关注的是 连接依赖,要求每个数据表的拆分是合理的,且所有的拆分都应该能够通过连接操作恢复。
  • 它的主要目的是消除由于复杂多对多关系引起的冗余。

5NF 示例:
假设有一个表记录了员工、项目和技能的信息:

员工ID项目ID技能
1101编程
1101设计
1102编程
2101设计
2102编程

在这个表中,员工ID、项目ID 和 技能 之间存在复杂的多对多关系。为了保持 5NF,我们需要拆分表格,以便每个表只描述一个单一的多对多关系。
拆分后的表:

  1. 员工项目表:
    员工ID项目ID
    1101
    1102
    2101
    2102
  2. 员工技能表:
    员工ID技能
    1编程
    1设计
    2设计
    2编程
  3. 项目技能表:
    项目ID技能
    101编程
    101设计
    102编程

这样,表格被拆分后,可以通过连接操作恢复所有数据,且不存在任何连接依赖,符合 5NF。

7. 记忆法

1. 使用简化的口诀或记忆法

记忆顺序:
1NF → 2NF → 3NF → BCNF → 4NF → 5NF

记住每个范式的核心概念及其解决的问题:

  • 1NF:原子性(数据不能重复,必须是单一值)。
  • 2NF:消除部分依赖(每个非主属性都必须完全依赖于主键)。
  • 3NF:消除传递依赖(非主属性不能依赖于其他非主属性)。
  • BCNF:每个决定因素都是候选键(更严格的3NF)。
  • 4NF:消除多值依赖(避免两个不相关属性集之间的依赖)。
  • 5NF:消除连接依赖(表拆分后可通过连接恢复,避免复杂的连接依赖)。

记忆法:
“原子完全传递候选,多值连接" —— 用来记住每个范式的解决问题:

  • 原子:1NF(原子性)
  • 完全:2NF(完全依赖)
  • 传递:3NF(传递依赖)
  • 候选:BCNF(候选键)
  • 多值:4NF(多值依赖)
  • 连接:5NF(连接依赖)

2. 关联实例,逐步拆解

通过实例化的方式逐步理解和记忆每个范式的含义。先从一个实际的、带有冗余问题的表开始,逐步通过范式的规范化过程来消除问题。
例如,使用一个简单的表来说明每个范式:

  • 1NF:学生ID、课程名、教师信息一行一值,不允许多值列。
  • 2NF:从1NF拆解出来,解决了“学生姓名”只依赖“学生ID”这个部分依赖。
  • 3NF:从2NF拆解出来,解决了“教师姓名”通过“教师工号”传递依赖的问题。
  • BCNF:更严格的要求,消除“教师工号”决定“教师姓名”的问题。
  • 4NF:解决了多个独立的多值依赖,学生可以选修多个课程,也可以有多个兴趣爱好,避免这些属性混杂在一起。
  • 5NF:消除了复杂的连接依赖,保证了拆分表后能通过连接恢复完整数据。

3. 用简短问题检查范式

用一些快速的检查问题来帮助判断某个表是否符合某个范式:

  1. 1NF:每个字段是否只有一个值?
  2. 2NF:表是否有复合主键,并且非主属性完全依赖于主键?
  3. 3NF:表中是否有非主属性依赖于其他非主属性?
  4. BCNF:是否所有决定其他属性的字段都是候选键?
  5. 4NF:是否存在多个独立的多值依赖?
  6. 5NF:是否所有表的拆分可以通过连接恢复,没有连接依赖?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/93304.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/93304.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java开发主流框架搭配详解及学习路线指南

文章目录一、前言🔗二、主流Java框架搭配2.1 Spring Boot MyBatis-Plus Spring Cloud2.2 Spring Boot Spring Data JPA Spring Cloud2.3 Quarkus/Vert.x (响应式编程栈)三、技术选型建议四、Java学习路线指南阶段1:Java基础 (4-6周)阶段2&#xff1a…

flutter-使用device_info_plus获取手机设备信息完整指南

文章目录1. 概述2. 安装与配置3. 基本使用方法3.1. 创建实例3.2. 区分平台获取信息4. 详细信息获取4.1. Android 设备信息4.2. iOS 设备信息4.3. Web 浏览器信息4.4. Windows 设备信息5. 实战示例6. 注意事项6.1. 权限问题6.2. 隐私保护6.3. 平台差异处理6.4. 性能考虑7. 常见问…

Java 时间处理 API 全解析:从 JDK7 到 JDK8 的演进

个人主页-爱因斯晨 友友们,互三咯~ 目录 个人主页-爱因斯晨 ​编辑 前言 一、JDK7 时间处理基石 ——Date 类 (一)Date 类基本功能 (二)Date 类的局限性 二、格式化时间好帮手 ——SimpleDateFormat 类 &#…

duiLib 实现鼠标拖动标题栏时,窗口跟着拖动

1、布局文件,窗口需设置可拖动的标题栏区域:2、HandleMessage函数中,处理WM_LBUTTONDOWN消息,判断鼠标在标题栏,让系统处理窗口移动。代码片段如下:else if (uMsg WM_LBUTTONDOWN) {// 获取鼠标点击坐标PO…

图解嵌入式硬件知识库体系

构建一个嵌入式硬件知识库体系需要涵盖嵌入式系统设计、开发和应用的各个方面,内容全面且系统化,适合不同层次的用户。本文是一个结构化的嵌入式硬件知识库体系,包含主要内容模块及其详细说明。 @startmindmap * 嵌入式硬件知识库体系 ** 1. 嵌入式系统基础 *** 概述与定义 …

机器学习的特征工程(特征构造、特征选择、特征转换和特征提取)详解

特征工程是机器学习中至关重要的一步,它直接影响模型的性能和泛化能力。特征构造、特征选择、特征转换和特征提取——构成了特征工程的核心流程。下面我来系统地梳理一下它们的定义、方法和应用场景: 整理 by Moshow郑锴https://zhengkai.blog.csdn.net/…

Force Dimension触觉力反馈设备在外科手术机器人遥操作和训练中的应用

触觉力反馈设备通过传感器-执行器-信号处理闭环系统,在外科手术机器人领域实现了从远程手术操作到虚拟训练的全流程革新。外科手术机器人外科医生广博的专业知识往往受限于他们的主要工具——手。机器人的精确度和灵活性远远超过人手。然而,目前机器人还…

【网络与爬虫 00】试读

网络爬虫技术全栈指南:从入门到AI时代的数据采集革命 关键词:网络爬虫、Python爬虫、数据采集、反爬技术、分布式爬虫、AI爬虫、Scrapy框架、自动化数据提取、爬虫架构设计 摘要:本专栏是最全面的网络爬虫技术指南,涵盖从基础框架…

[Chat-LangChain] 前端用户界面 | 核心交互组件 | 会话流管理

链接:https://python.langchain.com/docs/tutorials/qa_chat_history/ Chat-LangChain技术栈 : LangChainLangGraphNext.jsWeaviate (向量存储)OpenAI (嵌入模型) docs:chat-langchain Chat LangChain 是一个智能聊天机器人,专为解答Lang…

编写和运行 Playbook

编写和运行 Playbook Playbook 介绍 adhoc 命令可以作为一次性命令对一组主机运行一项简单的任务。不过,若要真正发挥Ansible的能力,需要使用功能 playbook。 playbook 是一个文本文件,其中包含由一个或多个按特定顺序运行的play组成的列表。…

uniapp手机端video标签层级过高问题

当我们想以视频作为背景时,其他dom通过定位显示在视频上方,h5页面上调试发现可以正常使用,效果如下: 当放在手机上看,会发现,仅仅剩一个视频,本应在视频上层的元素不见了。 经过一番排查&#x…

【MyBatis批量更新实现】按照list传入批量更新

学习目标&#xff1a; <update id"updateModelEngineeringSpatialNode" parameterType"com.mxpt.model.manage.domain.ModelEngineeringSpatialNode">update model_engineering_spatial_node<trim prefix"SET" suffixOverrides",&…

VOFA+ 显示数据、波形

本篇&#xff0c;以最常用的串口通信作展示&#xff0c;示范如何通过VOFA显示数据波形。 一、VOFA 下载 VOFA 是一款面向嵌入式开发的上位机软件&#xff0c;专注于硬件数据实时可视化与调试。它通过高效协议&#xff08;如FireWater、JustFloat&#xff09;将原始字节流转化为…

MySQL 插入数据提示字段超出范围?一招解决 DECIMAL 类型踩坑

MySQL 插入数据提示字段超出范围&#xff1f;一招解决 DECIMAL 类型踩坑 在日常数据库操作中&#xff0c;我们经常会遇到各种字段类型相关的问题。今天就来聊聊一个常见的错误&#xff1a;插入数据时提示字段值超出范围&#xff0c;以实际案例带你搞懂 MySQL 中 DECIMAL 类型的…

一周学会Matplotlib3 Python 数据可视化-绘制误差条形图

锋哥原创的Matplotlib3 Python数据可视化视频教程&#xff1a; 2026版 Matplotlib3 Python 数据可视化 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 课程介绍 本课程讲解利用python进行数据可视化 科研绘图-Matplotlib&#xff0c;学习Matplotlib图形参数基本设置&…

JVM垃圾回收器

垃圾回收算法标记-复制缺点&#xff1a;内存利用率低&#xff0c;有一块区域无法使用。标记-清除缺点&#xff1a;1. 效率问题 (如果需要标记的对象太多&#xff0c;效率不高)2. 空间问题&#xff08;标记清除后会产生大量不连续的碎片&#xff09;标记-整理分代收集根据对象存…

科研工具的一些注意事项

Origin Origin导入数据之后&#xff0c;可以考虑 [删除数据连接器…] 导入数据之后&#xff0c;删除数据连接&#xff0c;这样当原来的文件移动之后&#xff0c;就不影响origin文件里面的数据。不然就会出现空白数据&#xff1a;当然&#xff0c;没有数据了也可以加载出来&…

美国服务器环境下Windows容器工作负载智能弹性伸缩

在北美数据中心加速数字化转型的今天&#xff0c;企业客户日益重视Windows容器工作负载的智能化管理。本文将深入探讨基于Azure Stack HCI&#xff08;混合云基础设施&#xff09;的弹性伸缩方案如何突破传统资源调度瓶颈&#xff0c;通过分析指标收集、策略配置、混合云联动三…

欧姆龙CP系列以太网通讯实现上位机与触摸屏监控

一、行业痛点在现代工业生产中&#xff0c;自动化生产线的控制系统的高效性与智能化程度对生产效率和产品质量有着至关重要的影响。然而&#xff0c;许多传统工业生产线中使用的欧姆龙CP系列系列PLC以太网模块&#xff0c;由于自身设计原因&#xff0c;并未配备以太网接口&…

【大语言模型 00】导读

【大语言模型00】导读&#xff1a;你的LLM全栈工程师进阶之路关键词&#xff1a;大语言模型、LLM、Transformer、深度学习、AI工程化、全栈开发、技术路线图摘要&#xff1a;这是一份完整的大语言模型学习指南&#xff0c;涵盖从数学基础到商业落地的200篇深度文章。无论你是AI…