Python打卡DAY31

DAY31:文件的规范拆分和写法

恩师@浙大疏锦行

 

知识点:

  1. 规范的文件命名
  2. 规范的文件夹管理
  3. 机器学习项目的拆分
  4. 编码格式和类型注解

一、机器学习项目流程:

1、数据加载:从文件、数据库、API 等获取原始数据。

    - 命名参考:`load_data.py` 、`data_loader.py`

2、数据探索与可视化:了解数据特性,初期可用 Jupyter Notebook,成熟后固化绘图函数。

    - 命名参考:`eda.py` 、`visualization_utils.py`

3、数据预处理:处理缺失值、异常值,进行标准化、归一化、编码等操作。

    - 命名参考:`preprocess.py` 、`data_cleaning.py` 、`data_transformation.py`

4、特征工程:创建新特征,选择、优化现有特征。

    - 命名参考:`feature_engineering.py`

5、模型训练:构建模型架构,设置超参数并训练,保存模型。

    - 命名参考:`model.py` 、`train.py`

6、模型评估:用合适指标评估模型在测试集上的性能,生成报告。

    - 命名参考:`evaluate.py`

7、模型预测:用训练好的模型对新数据预测。

    - 命名参考:`predict.py` 、`inference.py`

二、文件的组织

1、项目核心代码组织:

src/:存放项目的核心代码

src/data/:存放与数据相关的代码

src/models/:关于模型的代码

src/utils/:存放通用辅助代码

2、配置文件管理

config/目录

3、实验与探索代码

notebooks/或experiments/

4、项目产出物管理

data/:存放项目相关数据

models/:存放训练好的模型

reports/或output/:存储项目运行的报告文件/输出文件

三、编码格式和类型注解

1、编码格式

(1)编码声明必须出现在文件的前两行(通常是首行),否则会被忽略。

(2)如果编码格式没问题,可能是vscode的编码格式不是utf-8,可以尝试修改编码格式。

(3)常见的编码报错是因为字符串编码问题,可以尝试显式转化,即读取的时候转化为utf-8编码。

2、类型注解

def add(a: int, b: int) -> int:return a + bdef greet(name: str) -> None:print(f"Hello, {name}")
# 定义一个矩形类
class Rectangle:width: float      # 矩形宽度(浮点数),类属性的类型注解(不初始化值)height: float     # 矩形高度(浮点数)def __init__(self, width: float, height: float):self.width = widthself.height = heightdef area(self) -> float:# 计算面积(宽度 × 高度)return self.width * self.height

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85366.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85366.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

字符串大数 -减法

描述 以字符串的形式读入两个数字,编写一个函数计算它们的和,以字符串形式返回。 代码实现 大小判断:a - b 与 b - a 的绝对值相等将大的数放前面,抽离出结果的符号 import random s, t str(random.randint(1000, 9999)), s…

android google tts如何不联网内部预置多国语音包

在内置Google GMS服务的设备中,可以正常使用TTS,并且可以联网下载多国的语音包。然而,对于未通过GMS认证,只能使用基础的TTS英语播报,而且联网后是无法下载语音包的,会提示需要google service。本文基于以上…

Java 全栈开发学习:从后端基石到前端灵动的成长之路

目录 一、开篇:与 Java 全栈的初遇 二、后端学习:SpringBoot 构建稳健基石 (一)SpringBoot3 入门:简约而不简单的启程 (二)Spring Boot Web 应用开发:构建交互桥梁 (…

AquaCrop模型源代码分析、模型优化与敏感性分析、未来气候变化影响分析

AquaCrop是由世界粮食及农业组织(FAO)开发的一个先进模型,旨在研究和优化农作物的水分生产效率。这个模型在全球范围内被广泛应用于农业水管理,特别是在制定农作物灌溉计划和应对水资源限制方面显示出其强大的实用性。AquaCrop 不…

开源模型应用落地-让AI更懂你的每一次交互-mem0-QDrant-Streamlit(一)

一、前言 在人工智能迅猛发展的今天,大型语言模型(LLM)已经成为各行各业的重要工具。然而,尽管这些模型在生成文本、理解语义等方面表现出色,但它们仍然面临一个关键挑战——缺乏持久的记忆能力。传统的对话系统往往只能基于当前对话轮次进行回应,无法有效保留和利用历史…

RPC - Response模块

Requestor 类是一个请求-响应管理器,负责发送请求并处理响应,支持三种交互模式:同步、异步和回调。它跟踪所有发出的请求,当响应到达时将其匹配到对应的请求并进行处理。 newDescribe 函数解析 newDescribe 函数负责创建和注册一…

超高速10G采集卡

超高速10G采集卡是一款高端14位数据采集平台,旨在满足最具挑战性的测量环境。 特性: 单通道和双通道操作 单通道10GSPS或双通道5GSPS 7 GByte/s持续数据传输速率开放式FPGA支持实时DSP 脉冲检测固件选项波形平均固件选项 特征 单通道和双通道工作模式双通道5G…

One-Hot、BOW、TF-IDF、N-Gram区别

1. One-Hot Encoding (独热编码) 核心思想: 为语料库(所有文档的集合)中的每个唯一单词创建一个维度。对于一个特定的单词,在其对应的维度上标记为1,在所有其他维度上标记为0。 表示: 一个非常长的二进制向…

产品经理如何做用户调研和访谈

用户调研和访谈是产品经理挖掘用户需求、优化产品设计的核心环节。在一个完整的产品流程里面,用户调研和访谈是非常重要的。 当年史玉柱推出脑白金时,就曾带领团队在江苏很多城市进行了大量的走访(用户调研),和一帮老…

【python 读取抖音/小红书/微博今日头条/百度热点等平台的热点新闻】

轻松获取全网热点,Python助你掌握实时舆情 在信息爆炸的时代,抖音、小红书、微博、今日头条和百度热点等平台每天都会产生海量热门内容。无论是品牌营销、竞品分析还是舆情监控,掌握这些热点新闻至关重要。利用Python的强大爬虫技术&#xff…

【1.3 MySQL知识库 - 轻松理解版】

🚀 MySQL知识库 - 轻松理解版 一、MySQL核心知识顺口溜 🎵 🎤 经典记忆口诀 MySQL数据库,InnoDB引擎强 ACID事务特性,隔离级别四档 索引加速查询,B树是主梁 主从复制备份,读写分离扛 锁机制防…

计算机网络期末速成 网络层 判断及单选题

判断题 路由器和链路层交换机都被称为分组交换机。路由器与链路层交换机间的根本区别是:路由器在网络层存储转发IP数据报,链路层交换机在链路层存储转发帧。 A. 对 B. 错 答案: 对 解析: 路由器和链路层交换机确实都是分组交换机,但工作层次不同。路由器…

代理 AI 时代的隐私重构:从边界控制到信任博弈

过去,我们将隐私等同于边界与权限控制,依赖墙壁、锁和规则构筑防线。而如今,随着代理 AI 深度介入生活,成为能感知、决策的自主实体,它不仅处理数据,更在重塑我们的数字形象与内在认知。在此背景下&#xf…

C++实现手写strstr函数

strstr 函数用于在主字符串中查找子字符串的首次出现位置,以下是高效的实现方案: KMP算法优化版本 #include <iostream> #include <string> #include <vector> using namespace std; // 计算KMP算法的部分匹配表(PMT) vector<int> getNext(const…

Linux操作系统网络服务模块一SSH带外管理概述

前言&#xff1a; 在复杂的网络运维环境中&#xff0c;​SSH带外管理&#xff08;Out-of-Band Management&#xff09;​​ 是确保系统高可用性的核心技术手段。区别于依赖业务网络的“带内管理”&#xff0c;带外管理通过独立物理通道​&#xff08;如专用管理网口或串…

org.springframework.cloud.gateway 组件解释

org.springframework.cloud.gateway 是 Spring Cloud 生态系统中的一个新一代的、功能强大的 API 网关。 1. 什么是 API 网关 (API Gateway)&#xff1f; 在讲解 Spring Cloud Gateway 之前&#xff0c;我们先要理解它扮演的角色——API 网关。 在一个微服务架构中&#xff0…

linux ollama 下载安装

linux ollama 下载安装 ollama 下载地址ollama 手动安装解决找不到命令的问题升级[gcc](https://so.csdn.net/so/search?qgcc&spm1001.2101.3001.7020)Centos7 停止维护之后 [升级gcc||找不到devtoolset-8-gcc* 问题解决方案](https://www.cnblogs.com/Jedi-Pz/p/18447117…

2025 渗透工具:【中国蚁剑】连接一句话MUA文件 远控虚拟机靶机

温馨提示&#xff1a; 本程序仅作为虚拟机测试环境使用&#xff0c;请勿用于任何不当用途。使用即表示您同意自行承担可能产生的所有责任。 一、场景复现 1、PhpMystudy软件启动网页模拟靶机 小皮面板(phpstudy) - 让天下没有难配的服务器环境&#xff01; 2、开启apache 3、…

Datawhale 网络爬虫技术入门第2次笔记

正则表达式 正则表达式&#xff08;Regular Expression&#xff09;&#xff0c;⼀种使⽤表达式的⽅式对字符串进⾏匹配的语法规则。 正则的语法&#xff1a;使⽤元字符进⾏排列组合来匹配字符串。 在线测试正则表达式&#xff1a;在线正则表达式测试OSCHINA.NET在线工具,os…

详解Redis的集群模式(主从复制、哨兵与Cluster)

一、主从复制 (Master-Slave Replication) 1. 基本概念 主从复制是Redis最简单的集群模式&#xff0c;由一个主节点(Master)和一个或多个从节点(Slave)组成。 2. 工作原理 数据同步&#xff1a;从节点启动时会向主节点发送SYNC命令&#xff0c;主节点执行BGSAVE生成RDB文件并…