2.2.4

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import joblib
from xgboost import XGBRegressor

# 加载数据集

file_path = '大学生低碳生活行为的影响因素数据集.xlsx'  # 替换为实际的数据集文件路径
data = pd.read_excel(file_path)

# 显示数据集的前五行

print(data.head())

# 删除不必要的列并处理分类变量

data_cleaned = data.drop(columns=['序号', '所用时间'])  # 删除不必要的列

代码解释:

drop,dropna、drop_duplicates的区别

  • drop:用于删除指定的行或列,不涉及缺失值。

  • dropna:用于删除包含缺失值的行或列,不涉及指定的行或列。

  • drop_duplicates:用于删除重复

# 定义自变量因变量

# 定义目标变量和特征
target = '5.您进行过绿色低碳的相关生活方式吗?'  # 确保这是目标变量
features = data_cleaned.drop(columns=[target]) #清除因变量

X = __________
y = data_cleaned[__________]

---

X = features
y = data_cleaned[target]

代码解释:

x是自变量,y是因变量。目标变量是因变量。

所以,y是target

# 将数据拆分为训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 训练线性回归模型

model = LinearRegression()
model.fit(X_train, y_train)

代码解释:

# 保存训练好的模型

model_filename = '2.2.4_model.pkl'
joblib.__________(model, model_filename)

---

joblib.dump(model, model_filename)

# 进行预测

y_pred = model.predict(X_test)

results.to_csv(results_filename, index=False, sep='\t')  # 使用制表符分隔值保存到文本文件

    f.write(f'均方误差: {mean_squared_error(y_test, y_pred)}\n')
    f.write(f'决定系数: {r2_score(y_test, y_pred)}\n')

# 分析并纠正错误(示例:使用XGBoost)

# 训练XGBoost模型

xgb_model = __________(
    n_estimators=1000,  # 增加树的数量
    __________=0.05,  # 降低学习率
    max_depth=5,  # 调整树的深度
    subsample=0.8,  # 调整样本采样比例
    colsample_bytree=0.8  # 调整特征采样比例
)

----

xgb_model = XGBRegressor(

learning_rate=0.05,  # 降低学习率

代码解释:降低学习率learning_rate,记

# 将XGBoost测试结果保存到报告文件中

report_filename_xgb = '2.2.4_report_xgb.txt'
with open(report_filename_xgb, 'w') as f:
    f.write(f'均方误差: {mean_squared_error(y_test, y_pred_xg)}\n')
    f.write(f'决定系数: {r2_score(y_test, y_pred_xg)}\n')

代码解释:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/80428.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用IDEA创建Maven版本的web项目以及lombok的使用

1.新建项目 2.修改pom.xml 3.修改项目结构 4.在main/java下面写一个Servlet测试一下 然后当前页面往下滑 -Dfile.encodingUTF-8编写一句输出语句,测试是否成功部署配置,并选择到正确的位置: 回车以后 再回到idea里面,发现控…

【数据结构】1-3 算法的时间复杂度

数据结构知识点合集:数据结构与算法 • 知识点 • 时间复杂度的定义 1、算法时间复杂度 事前预估算法时间开销T(n)与问题规模 n 的关系(T 表示 “time”) 2、语句频度 算法中语句的执行次数 对于以上算法,语句频度:…

【Python 算法零基础 3.递推】

压抑与痛苦,那些辗转反侧的夜,终会让我们更加强大 —— 25.5.16 一、递推的概念 递推 —— 递推最通俗的理解就是数列,递推和数列的关系就好比 算法 和 数据结构 的关系,数列有点像数据结构中的线性表(可以是顺序表,也…

淘宝扭蛋机系统开发前景分析:解锁电商娱乐化新蓝海

在电商行业竞争日益白热化的当下,如何通过创新玩法提升用户粘性、激活消费潜力,成为平台突破增长瓶颈的关键。淘宝扭蛋机系统作为“电商娱乐”的跨界融合产物,正凭借其趣味性、随机性和社交属性,成为撬动年轻消费市场的潜力工具。…

NHANES指标推荐:UHR

文章题目:Elevated log uric acid-to-high-density lipoprotein cholesterol ratio (UHR) as a predictor of increased female infertility risk: insights from the NHANES 2013-2020 DOI:10.1186/s12944-025-02521-w 中文标题:对数尿酸与高…

【c库主要功能】

1 stdio.h 功能:处理文件和标准输入/输出流的各种函数和类型 包含变量: size_t:无符号整形,sizeof关键字的结果FILE:文件流类型,适合存储文件流信息的对象类型 库宏: stderr、stdin、stdout&a…

npm 报错 gyp verb `which` failed Error: not found: python2 解决方案

一、背景 npm 安装依赖报如下错: gyp verb check python checking for Python executable "python2" in the PATH gyp verb which failed Error: not found: python2 一眼看过去都觉得是Python环境问题,其实并不是你python环境问题&#xf…

常见的请求头(Request Header)参数

1. Accept 作用:告知服务器客户端支持的响应数据格式(如 JSON、XML、HTML)。示例:Accept: application/json(优先接收 JSON 格式数据)。 2. Content-Type 作用:说明请求体的数据格式&#xff08…

计算机网络:移动通信蜂窝网络指的是什么?

无线基站的蜂窝网络(Cellular Network)是现代移动通信系统的核心架构,其核心思想是通过蜂窝状小区划分和频率复用,实现广域覆盖、高效频谱利用和动态资源管理。以下从设计原理、网络架构、关键技术及实际挑战等方面深入解析蜂窝网络。 一、蜂窝网络的设计原理 1. 蜂窝结构…

【AI论文】对抗性后期训练快速文本到音频生成

摘要:文本到音频系统虽然性能不断提高,但在推理时速度很慢,因此对于许多创意应用来说,它们的延迟是不切实际的。 我们提出了对抗相对对比(ARC)后训练,这是第一个不基于蒸馏的扩散/流模型的对抗加…

Word文档图片和图表自动添加序号

0 Preface/Foreword Word文档是办公常用的文档,里面经常会插入图片或者表格,当表格和图片数量过多时,如果有些图片需要删除或者添加,那么大概率需要修改大量图片的序号或者引用记录,如果通过手工一个一个修改&#xf…

软件架构设计--期末复习

质量属性 参考视频:【13.5质量属性-架构评估】 在软件架构中,质量属性是衡量系统设计优劣的关键指标,通常分为运行时属性和非运行时属性。以下是一些常见的质量属性: 一、软件架构中的质量属性 运行时属性: 性能&am…

多指标组合策略思路

一种基于多种技术指标和日历因素的综合交易策略,旨在通过复杂的条件判断来预测市场的短期走势,并据此进行买卖操作。 策略概述 该策略的核心思想是通过结合多个技术指标和日历因素来判断市场的短期趋势,并在合适的时机进行买入或卖出操作。 具…

STM32 HAL驱动程序 内部Flash

hal_flash.c #include "hal_flash.h"volatile uint32_t flashWriteOffset SYS_APP_BAK_SAVE_ADDR_BASE; volatile uint32_t flashReadOffset SYS_APP_BAK_SAVE_ADDR_BASE;/* MCU OTA */ /*擦除指定的Flash页*/ void flash_erase_page(uint8_t flashPage , uint32_…

电子电路:什么是电流离散性特征?

关于电荷的量子化,即电荷的最小单位是电子的电荷量e。在宏观电路中,由于电子数量极大,电流看起来是连续的。但在微观层面,比如纳米器件或单电子晶体管中,单个电子的移动就会引起可观测的离散电流。 还要提到散粒噪声,这是电流离散性的表现之一。当电流非常小时,例如在二…

AI agent与lang chain的学习笔记 (1)

文章目录 智能体的4大要素一些上手的例子与思考。创建简单的AI agent.从本地读取文件,然后让AI智能体总结。 也可以自己定义一些工具 来完成一些特定的任务。我们可以使用智能体总结一个视频。用户可以随意问关于视频的问题。 智能体的4大要素 AI 智能体有以下几个…

react+html2canvas+jspdf将页面导出pdf

主要使用html2canvasjspdf 1.将前端页面导出为pdf 2.处理导出后图表的截断问题 export default function AIReport() {const handleExport async () > {try {// 需要导出的内容idconst element document.querySelector(#AI-REPORT-CONTAINER);if (!element) {message.err…

FFmpeg:多媒体处理的终极利器

FFmpeg详细介绍 1. 定义与基本概述 FFmpeg是一套开源的跨平台多媒体处理工具集,最初由法国程序员Fabrice Bellard于2000年开发,其名称源自“Fast Forward MPEG”,体现了其高效处理MPEG格式的能力。它不仅是命令行工具,还包含多个库和开发套件,支持视频转码、剪辑、合并、…

【应用开发十】pwm

1 应用层操作PWM 与LED设备一样,操作PWD也是通过sysfs方式 1) 所在目录:/sys/class/pwm,该目录下的文件为pwmchipX,为PWM控器,I.MX6ULL有八个pwm控制器 1.1 pwm 控制器 PWM控制器里内容(即pw…

LeetCode算 法 实 战 - - - 双 指 针 与 移 除 元 素、快 慢 指 针 与 删 除 有 序 数 组 中 的 重 复 项

LeetCode算 法 实 战 - - - 双 指 针 与 移 除 元 素、快 慢 指 针 与 删 除 有 序 数 组 中 的 重 复 项 第 一 题 - - - 移 除 元 素方 法 一 - - - 双 重 循 环方 法 二 - - - 双 指 针方 法 三 - - - 相 向 双 指 针(面 对 面 移 动) 第 二 题 - - -…