疏老师-python训练营-Day30模块和库的导入

@浙大疏锦行

知识点回顾:

  1. 导入官方库的三种手段
  2. 导入自定义库/模块的方式
  3. 导入库/模块的核心逻辑:找到根目录(python解释器的目录和终端的目录不一致)

作业:自己新建几个不同路径文件尝试下如何导入

一.学习知识点

DAY30

注意今天的文件有2个 day30.ipynb 和 day30.py

一、导入官方库

我们复盘下学习python的逻辑,所谓学习python就是学习python常见的基础语法+学习你所处理任务需要用到的第三方库

类别典型库解决的问题学习门槛
基础工具ossysjson操作系统交互、序列化数据(如读写 JSON 文件)
科学计算numpyscipy数值计算、线性代数、信号处理
数据分析pandasmatplotlib数据清洗、转换、可视化(如绘制折线图、柱状图)
Web 开发DjangoFlask快速搭建 Web 应用(如网站后台、API 接口)中高
机器学习scikit-learnTensorFlow机器学习算法(分类、回归、深度学习)
自动化脚本pyautoguipytest自动化测试、桌面操作自动化(如模拟鼠标键盘操作)
网络爬虫requestsScrapy从网页提取数据(需注意反爬机制和法律合规)

所以你用到什么学什么库即可。学习python本身就是个伪命题,就像你说学习科目一样,你没说清晰你学习的具体科目是什么,也没说学这个科目的哪些章节,毕竟每个科目都很大-----要有以终为始的思想。

所以我们这个训练营,正确的说法是:学习借助pythob掌握深度学习和机器学习所必备的基础知识和相关工具。

1.1 标准导入:导入整个库

这是最基本也是最常见的导入方式,直接使用import语句。

# 方式1:导入整个模块
import mathprint("方式1:使用 import math")
print(f"圆周率π的值:{math.pi}")
print(f"2的平方根:{math.sqrt(2)}\n")

1.2 从库中导入特定项

当使用from语法从库中导入特定的函数或类时,这些函数或类就可以在您的代码中直接使用,不需要添加模块名作为前缀。因为在导入时没有包括模块的完整路径,前面也不能加上库名。

# 方式2:导入特定的函数或变量
from math import pi, sqrtprint("方式2:使用 from math import pi, sqrt")
print(f"圆周率π的值:{pi}")
print(f"2的平方根:{sqrt(2)}\n")

类似的写法,如sklearn库很大,直接导入sklearn库会占用电脑大量内存,所以一般只导入你需要的库,

  • 如: from sklearn.model_selection import train_test_split

1.3 非标准导入:导入整个库

如下,●这将导入math模块中定义的所有公开函数和变量。 ●和上述from同理,直接调用sin()cos()等,而无需math.前缀。

虽然 import math和 from math import *看起来都是导入了 math 模块,但它们在导入方式、作用域处理以及对命名空间的影响上有重要的区别。

  1. 命名空间的污染 import math:这种方法会将整个 math 模块导入到命名空间中,但是需要使用 math. 前缀来访问模块内的函数或变量。这种方式保持了命名空间的整洁,因为所有的 math 函数和变量都包含在 math 这个模块对象中。 from math import *:这种方法将 math 模块中的所有公开的函数和变量导入到当前的命名空间中,可以直接使用这些函数和变量而无需 math. 前缀。这种方式可能会导致命名空间污染,特别是当有多个模块都被这样导入时,很容易发生命名冲突。

  2. 明确性和可维护性 import math:明确指出了函数和变量来源于 math 模块,这对代码的可读性和维护性都是有益的。其他阅读你代码的人可以清楚地看到每个函数的来源,这对大型项目和团队合作尤为重要。 from math import *:虽然代码看起来更简洁,但这种方法减少了代码的明确性。如果没有足够的上下文,很难判断一个特定的函数是来自 math 模块还是其他模块,尤其是当你导入了多个模块时。

from math import *print(f"圆周率π的值:{pi}")
print(f"2的平方根:{sqrt(2)}")

上述这些,如果是python内置库,可以直接导入,大部分第三方库都需要先用pip来安装。下面的模块,也就是.py文件,是不需要安装即可调用的。

模块、包的定义

模块(Module)

  • 本质:以 .py 结尾的单个文件,包含Python代码(函数、类、变量等)。
  • 作用:将代码拆分到不同文件中,避免代码冗余,方便复用和维护。

包(Package)

在python里,包就是库

  • 本质有层次的文件目录结构(即文件夹),用于组织多个模块和子包。
  • 核心特征:包的根目录下必须包含一个 __init__.py 文件(可以为空),用于标识该目录是一个包。

使用案例

若编写一个计算圆面积的代码并保存为 circle.py,这个文件就是一个模块。

使用时通过 import circle 导入模块,调用其中的函数(如 circle.calculate_area(5))。

# circle.py
import mathdef calculate_area(radius):return math.pi * radius ** 2

IDE(如 VSCode 或 PyCharm)通常会将你打开的项目文件夹设为“根目录”(或者说,运行时的工作目录)。Python 在导入模块时,会从这个根目录(以及其他一些标准位置和脚本所在的目录)开始查找。

场景1: main.py 和 circle.py 都在同一目录

目录结构:

项目根目录/
├── main.py
└── circle.py

main.py 内容:

# main.py
from circle import calculate_area
# 或者: import circle (然后用 circle.calculate_area)radius = 5
area = calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")

运行方案:直接在终端python main.py

这里的终端可以通过左上角的查看-终端 打卡,默认的路径是你的项目根目录。

我觉得这是我今天最难的地方,如果是点开三角运行,没有问题,会出现没有问题对吧。但是,当我执行,发现没反应。然后我看都我的终端有这种红色字,然后我就去问豆包,在问了14次,中间不断的用它的方案改了之后,终于第14次好了。看下图。注,nog是我anaconda中的环境。

接下来,我把豆包最后一次(最有帮助)给我的方案分享给大家,并且,我也会实操一遍。其实我一开始进老师的复试班时就有了红字这个问题,但是当时的任务不影响,就偷懒没弄,今天既然要做这个,就要解决掉这个问题。伟大的ai,伟大的豆包,真了不起。如果大家有其他问题,比如上面目录只是到60天训练营,而不是场景一的根目录,问豆包,它会告诉你用cd命令,如下。

现在我给大家看一下,执行老师的操作(在终端输入python main.py),这个hello是我加的。

豆包方案:

从报错来看,这是 PowerShell 执行策略限制 导致 conda init 配置的脚本无法运行,进而 conda activate 失败。以下是 最简解决步骤


1. 以管理员身份打开 PowerShell

  • 关闭 VS Code 终端,从 开始菜单 找到 Windows PowerShell → 右键选择 以管理员身份运行

2. 修改执行策略(仅需一次)

在管理员 PowerShell 中运行:

 

powershell

Set-ExecutionPolicy RemoteSigned -Force
 
  • 作用:允许运行本地脚本(conda init 写入的 profile.ps1 属于本地脚本)。

3. 重启 VS Code 并激活环境

  • 关闭所有 VS Code 窗口,重新打开项目;
  • 打开 VS Code 终端(自动是 PowerShell 类型),执行:

    powershell(这个nog是我的环境名,你弄你自己的)

    conda activate nog
    

核心原因

Windows PowerShell 默认执行策略是 Restricted(限制运行脚本),导致 conda init 写入的 profile.ps1 无法加载。通过管理员权限修改执行策略为 RemoteSigned 即可解决。

我按照豆包老师的三步走:

1. 以管理员身份打开 PowerShell

要先关闭vscode

2.修改执行策略(仅需一次)

这行代码复制到图片内容中,回车。

Set-ExecutionPolicy RemoteSigned -Force

3.重启 VS Code 并激活环境

前两步你已经关闭了vscode,你完成前两部后打开vscode,输入以下代码。我的环境叫nog,你弄你自己的环境名。

conda activate nog

假如出现,你就先conda init再activate。(当然我前两部做完后,没出现这个问题)

场景2: main.py 和 circle.py 都在根目录的子目录 model/ 下

目录结构:

项目根目录/
└── model/├── __init__.py   (推荐添加,将 model 目录标记为包)├── main.py└── circle.py

model/main.py 内容:

# model/main.py
from circle import calculate_area
# 或者: import circle (然后用 circle.calculate_area)radius = 5
area = calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")

运行方案:

  1. 运行命令:python model/main.py
  2. 进入路径:cd xxx(main的相对路径),然后执行python main.py (注意如果先cd后,就不能采用第一个命令了)

首先,我们前面进入的是场景1,现在先要回退到60天训练营,回退命令如下,回退示例如图

cd ..

退出到60天训练营,再cd到使用场景2,再执行python model/main.py。

老师说的直接运行命令:python model/main.py,我这里不行,我觉得可能是老师和我的路径不一样,我的路径很复杂,好多层文件夹。

我按照老师的直接在60天训练营输入python model/main.py会报错,因为不是根目录,当然找不到文件啊。所以一定要到场景2去输入python model/main.py。

场景3: main.py 在根目录,circle.py 在子目录 model/ 下

目录结构:

项目根目录/
├── main.py
└── model/├── __init__.py   (必需添加,将 model 目录标记为一个可导入的包)└── circle.py

main.py 内容:

# main.py
from model.circle import calculate_area
# 或者: from model import circle (然后用 circle.calculate_area,因为此时你是导入了整个模块)radius = 5
area = calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")

运行方案:直接在终端python main.py

如果你是和我一样,边修改文件(比如场景1先往里面放py文件,场景234空的,做场景2再添场景2里面的py文件,不一下弄完的原因是github上我没看到有下载文件夹的导致我只能一个一个下,我又比较急,就边做边弄)那你可能会出现如下图的问题,只要ctrl+s保存一下就行。很好解决。

场景4:是最复杂的是包里的函数掉另一个包里的函数

项目根目录/
├── circle2.py
└── utils/├── __init__.py   (必需添加,将 model 目录标记为一个可导入的包)└── circle.py
└── model/└── main.py

运行方式 python -m model.main

如果直接使用python model/main.py,会报错, 当使用 python -m model.main 时,Python 会将当前目录(即项目根目录)添加到 sys.path 的开头。

python model/main.py,会报错,报错如下:

那我们去输入python -m model.main,得到结果是下图。

看起来好容易啊,其实一点也不,你在场景4可能经常报错,如下图。有两个解决方案1.删除 __pycache__ ,这就是个缓存文件。无论你是场景1234只要你某次出错,就删掉(4出错,我把1234的缓存全删了再保存就不报错了)。2.删完后要保存ctrl+s这一点超级重要。3.你也可以关掉重启试试。

之前错了好几次了,一直都是报红框里的错误,其实我代码明明长下图这样。没有model.circle明明是utils里的circle。最后就是靠删除场景1234的缓存和保存,再执行python -m model.main才弄好。

然后我还要说一下,为什么要加M,问了豆包,理由不用看。什么时候加M知道就行。

结束了吗,哈哈还没有,场景4里还有一个文件再学习一下。这个内容是教我们如何当主函数是ipynb格式时如何调用py格式的包。因为前1234都是py导py。

学习ipynb格式导py格式包,这个ipynb实在场景4的model包中的

发现sys.path里没有60天训练营和场景4是吧。

因为utils并不在model这个路径下,所以直接运行会报错

有2类策略:

  1. 把utils路径加入到sys.path中
  2. 在py文件的终端中直接用python -m model.main 运行,这种导入方法会默认从根目录开始查找。

ps:之所以你会感觉终端的命令明明是根目录,但是运行时却找不到,是因为python解释器理解的目录和终端的目录不一样,通过sys.path可以查看解释器理解的目录

第2个方法前面在场景4做过了输入python -m model.main就会从根目录(红框内)找

第一个方法看一下

红框说明添加导sys.path了

所以导入包的核心就是找到目录,只有理解了python解释器的目录关系,才能导入包,如果py文件中导入失败,不妨多调试几次路径即可-----一点心得,经常跑别人的项目都是在这里有问题。

如果你在手欠一点,点一下场景4main.py文件的一个三角形(直接运行,非终端运行),会报错

终端运行没事

为什么看豆包,有3个方案。方案1太麻烦不做了

方案1

方案2及演示,特像ipynb导入py的操作

方案3

三、源代码的查看

如果第三方库是纯python写的,往往在函数上按住ctrl即可进入函数内部查看源代码。 但是很多第三方库为了性能,底层是用其他语言写的,这里我们计算机视觉库OpenCV为例。 OpenCV核心是用C++编写的(C++可以显著提高性能),但它通过Python等其他语言的接口(bindings)使得这些功能可以在Python环境中被调用。这些接口是通过一种叫做Python/C API的技术实现的,其中C++的功能被封装成Python模块,使得Python用户可以像使用纯Python编写的库一样使用OpenCV。 OpenCV的核心是用C++编写,并且已经编译成二进制文件,编译后的二进制文件可以在不同操作系统上运行,Python中的用户通常不能直接看到方法的源代码。

二进制文件是机器语言,处理器可以直接理解和执行无需翻译,二进制语言反汇编是很困难的,用二进制语言除了效果好外,也是让用户无法看到源代码,保护了自己的知识产权。

这意味着: ●二进制文件dll文件:当你在Python中导入OpenCV库(通import cv2),你实际上是在调用预先编译好的二进制文件。这些文件包含了实现OpenCV功能的可执行代码,而非人类可读的源代码。 ●接口封装:用户只能看到Python函数和对象的接口(即函数的定义,不包括实现的细节)。这也意味着无法从利用ctrl跳转到函数内部,pycharm的debugger功能同理也无法看到内部结构。 ●文档和源代码:尽管在Python中不能直接看到C++的源代码实现,用户可以参考官方文档来了解各个函数和方法的用法。如果需要查看实现细节,可以访问OpenCV的GitHub仓库查看C++源代码。

这就需要我们养成看文档的能力,文档就是以终为始思想的体现。文档就是api使用说明书,可能你日常买东西都不喜欢看使用说明书,但是在代码学习中,这一步是绕不开的。 你会发现很多B站视频的教学,其实远不如文档说明书细致。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/91310.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/91310.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

神经网络知识讨论

AI 核心任务与数据类型:特征提取核心:AI 的核心是从原始输入数据中提取特征,CV 是将图像数据转换为计算机可识别的特征,NLP 是将文本数据转换为特征,数据挖掘是将结构化数据转换为特征。数据类型特点:图像数…

kotlin类型可为空,进行空安全的区别

定义一个可为空的变量b(String?),默认没有?是不可以为空的 var b: String? "Kotlin" b null print(b) // 输出 null默认不可为空 var a: String "Kotlin" a null // 编译器报错,null 不能被赋给不为空的变量空安全调用&#x…

Mysql事务基础

事务是一个不可分割的数据库操作序列,也是数据库并发控制的基本单位,其执行的结果必须使数据库从一种一致性状态变到另一种一致性状态。事务是逻辑上的一组操作,要么都执行,要么都不执行 事务的特点 A(Atomicity&#…

FastAPI入门:安装、Pydantic、并发和并行

本系列参考FastAPI官方文档:https://fastapi.tiangolo.com/zh/python-types/安装 使用pip安装: pip install fastapi此外还需要 ASGI 服务器,生产环境可以使用 Uvicorn 或者 Hypercorn。 ASGI服务器:异步服务网关接口,…

欢乐的周末 - 华为OD统一考试(JavaScript 题解)

题目描述 小华和小为是很要好的朋友,他们约定周末一起吃饭。 通过手机交流,他们在地图上选择了多个聚餐地点(由于自然地形等原因,部分聚餐地点不可达)。 求小华和小为都能到达的聚餐地点有多少个? 输入描述 第一行输入m和n,m代表地图的长度,n代表地图的宽度 第二行…

算法竞赛阶段二-数据结构(38)数据结构动态链表list

动态链表(List)的基本概念动态链表是一种线性数据结构,通过节点间的指针连接实现动态内存分配。与数组不同,链表的大小可随需增减,插入和删除操作的时间复杂度为 O(1)(已知位置时),但…

Qt 移动应用推送通知实现

推送通知是移动应用提升用户粘性的核心功能——无论是即时消息提醒、活动推送还是状态更新,都需要通过推送功能触达用户。Qt虽未直接提供跨平台推送API,但可通过集成原生服务(如Firebase Cloud Messaging、Apple Push Notification service&a…

Word和WPS文字如何制作分栏试卷?想分几栏分几栏

使用Word和WPS文字制作试卷的时候,通常会使用A3大小的纸张,横向布局。但是如果题目的题干、问题、选项文字太少,会带来试卷上有较大的空白,既不美观又浪费纸,解决办法就是将试卷分栏,根据需要分成多栏&…

ubuntu 安装vmware tools

VMware Workstation菜单栏->虚拟机->安装VMware Tools 打开ubuntu内加载的光盘,复制VMwareTools-10.3.26-22085142.tar.gz,解压出来 sudo ./vmware-install.pl #执行安装软件 VMware Tools 安装完成以后重启Ubuntu,重启以后就可以直…

【实时Linux实战系列】在实时应用中进行负载均衡

在实时应用中,负载均衡是确保系统能够高效处理多个任务的关键技术。通过合理调度任务到不同的处理单元,负载均衡可以提高系统的整体性能,减少延迟,并提高资源利用率。在实时 Linux 系统中,负载均衡尤为重要&#xff0c…

bash的特性-命令和文件自动补全

一、前言在 Linux Shell 编程和日常使用中,Bash 的自动补全功能 是一个非常强大且实用的特性。它不仅可以节省输入时间,还能有效减少拼写错误,提升命令执行效率。本文将带你全面了解 Bash 的自动补全机制,包括:✅ 命令…

Ubuntu系统 系统盘和数据盘扩容具体操作

Linux磁盘配置和需求,以下是完整的操作方案: 可以看到系统盘vda3 还有48GB 数据盘则是还有512GB没有挂载使用,下面是完成数据扩容的具体操作 一、完成系统盘扩容(使用98GB空间) # 1. 扩展逻辑卷(LVM架构&am…

从0到1学Pandas(七):Pandas 在机器学习中的应用

目录一、数据预处理1.1 特征提取1.2 数据标准化与归一化1.3 特征编码二、特征工程2.1 特征选择​2.2 特征组合与衍生​2.3 缺失值处理策略​三、模型训练与评估3.1 数据集划分3.2 模型训练与预测3.3 模型评估与调优四、Pipeline 构建4.1 自动化工作流4.2 模型部署与应用4.3 模型…

LangChain和LangGraph 里面的 `create_react_agent`有什么不同

这两个函数虽然名称相同,但来自不同的库(LangChain 和 LangGraph),它们在实现和使用上有一些关键区别: 主要区别特性LangChain 的 create_react_agentLangGraph 的 create_react_agent所属库LangChainLangGraph设计目的…

PostgreSQL 与 Oracle 数据库字段类型的详细对比

一、数值类型对比数据类型OraclePostgreSQL说明整数NUMBER(p,0)SMALLINT/INT/BIGINTOracle 统一用 NUMBER,PG 区分精度范围浮点数BINARY_FLOATREAL单精度浮点双精度浮点BINARY_DOUBLEDOUBLE PRECISION双精度浮点高精度小数NUMBER(p,s)NUMERIC(p,s)精确数值存储自增序…

JVM 性能调优实战:让系统性能 “飞” 起来的核心策略

在 Java 应用的生命周期中,性能问题如同隐藏的 “暗礁”—— 初期可能不显眼,但随着用户量增长和业务复杂度提升,微小的性能损耗会被无限放大,最终导致系统响应迟缓、频繁卡顿甚至崩溃。JVM 性能调优的目标,就是通过优…

Android Handler 完全指南

在 Android 开发中,Handler 是线程通信的核心工具 —— 当你在子线程下载图片后需要更新 UI,当你在 TCP 连接中收到数据需要通知界面,当你需要延迟执行某个任务时,都会用到 Handler。这个看似简单的类,却蕴含着 Androi…

梳理Ego-Planner模式下5通道、6通道与无人机模式的关系

Copilot said: 你需要梳理Ego-Planner模式下5通道、6通道与无人机模式的关系,以及轨迹跟随、紧急情况和人工接管的流程。下面结合你的描述和三张图片,对核心逻辑进行总结和整理: --- ## 一、状态组合与对应模式(见图1)…

odbc和jdbc什么区别

ODBC 和 JDBC 都是用于连接和操作数据库的标准接口,但它们分别面向不同的编程语言和平台。下面是它们的区别与对比,帮助你理解它们的用途和适用场景。📊 一、基本概念对比特性ODBC(Open Database Connectivity)JDBC&am…

境外期货Level2高频Tick历史行情数据获取与应用指南

在金融量化分析中,本地数据的高效使用是提升策略效果的重要基础。本文以CSV格式的本地数据为核心,以外盘期货分钟数据、CME/COMEX/CBOT历史行情为例,阐述专业化的数据处理与应用方法,为研究者提供可行性方案。一、数据预处理标准化…