决策树(1)

一、树模型与决策树基础

决策树概念:从根节点开始一步步走到叶子节点得出决策,所有数据最终都会落到叶子节点,既可用于分类,也可用于回归。

树的组成

    根节点:第一个选择点。

    非叶子节点与分支:中间决策过程。

    叶子节点:最终的决策结果。

二、决策树的训练与测试

训练阶段:从给定的训练集构造树,核心是从根节点开始选择特征并进行特征切分。

测试阶段:根据构造好的树模型从上到下走一遍即可完成分类或回归任务。

难点:如何构造出一棵树,涉及特征选择与切分等问题。

三、特征切分相关衡量标准

核心问题:如何选择根节点及后续节点的特征,如何进行切分。目标是通过衡量标准找到能更好切分数据(分类效果更好)的特征作为节点。

    定义:表示随机变量不确定性的度量,公式为H(X)=- ∑ pi * logpi, i=1,2, ... , n。

    特点:不确定性越大,熵值越大;

信息增益:表示特征X使得类Y的不确定性减少的程度,分类后希望同类数据在一起,即提高分类的专一性。

四、决策树构造实例

数据与目标:基于14天打球情况的数据,包含4种环境变化特征,目标是构造决策树。

计算过程

    原始数据中9天打球,5天不打球,先计算此时的熵。

    对4个特征逐一分析,以outlook特征为例,计算其不同取值时的熵值,再结合各取值的概率计算该特征下的总熵值,进而得出信息增益。

    选择信息增益最大的特征作为根节点,再在剩余特征中按同样方式选择后续节点。

 五、课堂练习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/93692.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/93692.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电视系统:开启视听新时代

在当今数字化浪潮席卷的时代,电视领域正经历着一场深刻的变革,而电视系统无疑是这场变革中的耀眼明星。简单来讲,电视系统就是互联网协议电视,它宛如一座桥梁,巧妙地利用宽带有线电视网,将多媒体、互联网、…

字节开源了一款具备长期记忆能力的多模态智能体:M3-Agent

猫头虎AI分享|字节开源了一款具备长期记忆能力的多模态智能体:M3-Agent 近年来,多模态大模型的发展迅猛,但如何赋予智能体类似人类的长期记忆能力,一直是研究中的核心挑战。字节跳动开源的 M3-Agent,正是面…

第十六届蓝桥杯青少组C++省赛[2025.8.10]第二部分编程题(6、魔术扑克牌排列)

参考程序&#xff1a;#include<bits/stdc.h> using namespace std; long long dp[105]; long long c(int n) {dp[0] 1;for(int i1; i< n; i){for(int j0; j<i; j){dp[i] dp[j] * dp[i -1-j];}}return dp[n]; } int main() {int n;cin >> n;cout <<c(n…

【实时Linux实战系列】实时平台下的图像识别技术

在当今数字化时代&#xff0c;图像识别技术已经广泛应用于各个领域&#xff0c;如自动驾驶、安防监控、智能医疗等。它通过计算机对图像进行分析和处理&#xff0c;从而实现对物体、场景或人的识别。实时Linux作为一种高效的实时操作系统&#xff0c;为图像识别技术提供了强大的…

IPD流程执行检查表

IPD流程执行检查表 稽查

Jmeter的安装与使用教程

基于jdk1.8版本的Jmeter的下载与安装和使用教程。 一.安装jmeter 官网下载就行下载压缩包解压就行 Jmeter下载官网&#xff1a;http://jmeter.apache.org/download_jmeter.cgi找到安装包的下载位置&#xff0c;解压进入文件夹的bin文件夹下jmeter.bat。二.配置环境变量 1、“此…

docker 数据卷、自定义镜像操作演示分享(第二期)

数据卷1.1、背景前面有个docker go web demo应用示例&#xff0c;每次为了部署go_web_demo工程&#xff0c; 需要将使用到的cp的命令将宿主主机内的go_web_demo目录下的代码文件&#xff08;一般是编译后的二进制执行文件&#xff09;复制到容器内部。 数据卷&#xff1a;将宿主…

Pandas 入门到实践:核心数据结构与基础操作全解析(Day1 学习笔记)

目录 一、Pandas 概述 1. 什么是 Pandas 二、核心数据结构 1. Series 索引 显示索引 隐式索引 创建方式 属性与方法 数据访问 索引访问 切片访问 布尔索引 2. DataFrame 创建方式 属性与数据访问 数据修改 三、索引操作 1. 索引类型 2. 核心索引方法 3. 切…

hadoop技术栈(九)Hbase替代方案

一、 核心替代方向 ‌云原生托管NoSQL服务&#xff1a;‌ ‌Google Cloud Bigtable&#xff1a;‌ 这是HBase在云端的“官方”替代品&#xff0c;兼容HBase API&#xff0c;底层存储和架构高度优化&#xff0c;提供高吞吐、低延迟、无缝扩展、完全托管的服务。‌如果追求兼容性…

深度解析 DDoS 攻击:运作机制与防御体系构建​

在网络安全领域&#xff0c;DDoS&#xff08;分布式拒绝服务&#xff09;攻击始终是企业与机构的 “心腹大患”。它通过操控大量 “傀儡主机” 发起海量请求&#xff0c;直接瘫痪目标服务器或网络链路&#xff0c;导致业务中断、用户流失甚至品牌声誉受损。今天&#xff0c;我们…

在linux系统中下载Andconda

下载前的准备工作 在开始下载 Anaconda 之前&#xff0c;做好充分的准备工作能避免后续出现不必要的麻烦&#xff0c;让整个过程更加顺畅。 确认系统架构 Linux 系统有 32 位和 64 位之分&#xff0c;不同架构对应的 Anaconda 安装包不同。你可以通过以下命令查看系统架构&a…

学习threejs,使用EffectComposer后期处理组合器(采用RenderPass、UnrealBloomPass、FilmPass渲染通道),实现交互式 3D blob

&#x1f468;‍⚕️ 主页&#xff1a; gis分享者 &#x1f468;‍⚕️ 感谢各位大佬 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍⚕️ 收录于专栏&#xff1a;threejs gis工程师 文章目录一、&#x1f340;前言1.1 ☘️THREE.EffectComposer 后期处…

LLM - windows下的Dify离线部署:从镜像打包到无网环境部署(亲测,包含插件部署)

一、离线部署原理 通过Docker的save/load机制实现镜像的物理介质迁移,配合Docker Compose编排文件的环境适配能力,可在完全断网的环境中快速部署复杂应用。整个过程分为在线环境准备和离线环境还原两个阶段。 二、在线环境操作 1. 环境准备 在线环境:一台可以访问互联网的…

前端学习之后端小白java的一些理论知识(框架)

一、Spring Framework 和 Spring boot的区别 核心定位 Spring Framework&#xff1a;一个全面的Java应用开发框架&#xff0c;提供核心功能如IoC容器、AOP等Spring Boot&#xff1a;Spring Framework的扩展&#xff0c;专注于简化Spring应用的初始搭建和开发过程 配置方式 Spri…

K8S的ingress

一。ingress的介绍对于NodePort和LoadBalance&#xff0c;这两种方法&#xff0c;都有缺点&#xff1a;1.NodePort方式缺点会占用很多集群的端口&#xff0c;当集群服务变多的时候&#xff0c;缺点更加显著2.LB的缺点就是每一个service都需要一个LB&#xff0c;浪费&#xff0c…

实现自己的AI视频监控系统-序章

目录简介视频监控系统是什么&#xff1f;该系列课程你会学到什么&#xff1f;需要准备哪些工具&#xff1f;下期预告简介 在当今快速发展的科技时代&#xff0c;人工智能&#xff08;AI&#xff09;已经深入到我们生活的方方面面。其中&#xff0c;AI视频监控系统作为安防领域…

Pytorch GPU版本安装保姆级教程

本文将介绍在anaconda环境下安装pytorch的详细步骤。 Anaconda安装教程参考Anaconda安装保姆级教程。 目录 一、工具安装 二、创建虚拟环境 三、安装Pytorch CUDA Toolkit安装 Pytorch安装 总结 一、工具安装 点击链接官网codetou.com&#xff0c;下载安装最新版即可&…

重学React(六):脱围机制二

背景&#xff1a; 话不多说&#xff0c;继续学习&#xff0c;现在是Effect时间。 前期回顾&#xff1a; 重学React&#xff08;一&#xff09;&#xff1a;描述UI 重学React&#xff08;二&#xff09;&#xff1a;添加交互 重学React&#xff08;三&#xff09;&#xff1a;状…

【MySQL】索引(B+树详解)

MySQL(五)索引 一、索引的减I/O设计 1.读取量 2.搜索树 2.1方向 2.2有序 3.分多叉 3.1B树 弊端: 3.2B树 3.2.1非叶子-搜索字段 3.2.1.1海量分叉 3.2.1.1.1最大式 3.2.1.1.2最快式 3.2.1.2缓存内存 3.2.1.2.1字段总量小 3.2.1.2.2时间复杂度 3.2.1.3区间搜索向…

GPT-5博士级AI使用教程及国内平替方案

GPT-5博士级AI使用教程及国内平替方案一、GPT-5核心升级&#xff1a;到底强在哪里&#xff1f;1. **统一入口自动思考模式**2. **256K上下文40万汉字记忆**3. **人格系统长期记忆**4. **编程能力史诗级增强**二、注册与访问&#xff1a;国内用户也能免费上车1.官方渠道&#xf…