scikit-learn零基础配置(含python、anaconda)

一、Anaconda环境搭建

1、关于Anaconda

        Anaconda 是一个非常 popular 的 Python 发行版,它不仅包含了 Python 语言本身,还预装了众多常用的科学计算库,如 NumPy、Pandas、Matplotlib 等,能够极大地方便用户的开发和数据分析工作。Anaconda 提供了一个统一的环境管理工具,用户可以轻松创建和管理多个独立的 Python 环境,避免了不同项目之间的依赖冲突。此外,Anaconda 还提供了 Anaconda Navigator 这样的图形化界面,让用户更直观地管理包和环境。这对于刚开始学习 Python 或者需要处理复杂项目的用户来说,Anaconda 都是一个非常友好且强大的工具。

       很多人在使用Python时,直接就下载了特定版本的Python解释器,然后项目中途会使用到的哪些库,直接安装就行了,这样会带来一些问题:

       不同项目使用的库对Python的版本也许会有限制。比如有些库只能在Python2的版本下使用,有的只能在Python3的版本下使用;很多库在一次或者几次的项目中使用后,就很难再用到了,长期下来会积累很多这种已经没用的库,从而使包变得冗余,占用内存空间。
        针对直接安装Python会带来的这些问题,所以很多人都会使用anaconda,anaconda有以下好处:自带常用的库,能够满足一些基础简单的需要;可以创建多个环境,每个环境可以安装不同的Python版本,从而解决了版本冲突的问题。并且每个环境都可独立安装各自需要的库,应用于不同的项目,由此便于管理不同项目需要的特定的库。

2、Anaconda下载

        (1)下载Anaconda安装包

         进入 Anaconda 官网,注册或登录,在 Hub 中点击 Install Distribution,填写信息后下载即可。

         如果你的网络无法访问 Anaconda 官网或者下载速度较慢,可以从 清华大学开源软件镜像站 下载。或者直接使用我在群内提供的压缩包下载。

       (2)安装Anaconda

在 Anaconda 安装的过程中,比较容易出错的环节是环境变量的配置,所以大家在配置环境变量的时候,要细心一些。

        双击下载好的安装包,点击 Next,点击 I Agree,选择 Just Me,选择安装路经(安装在 C 盘也有好处,不过与 C 盘爆炸来说不值一提,建议按在其他盘)然后 Next,来到如下界面:

        请选择 Register Anaconda as my default Python 3.x,不要选 Add Anaconda to my PATH environment variable,我们需要后期手动添加环境变量。

        点击 Install,安装需要等待一会儿。

        最后一直 Next,直到安装完成。

        对于两个“learn”,都取消打勾,不用打开去看了,耽误时间。

      (3)配置环境变量

        此电脑(右键)→ 属性 → 高级系统设置 →(点击)环境变量

        在下面系统变量里,找到并点击 Path

在编辑环境变量里,点击新建

        输入下面的五个环境变量。(这里不是完全一样的!你需要将以下五条环境变量中涉及的到的"D:\_Producers\Anaconda3"都修改为你的 Anaconda 的安装路径!

E:\environment\anaconda3
E:\environment\Anaconda3\Scripts
E:\environment\Anaconda3\Library\bin
E:\environment\Anaconda3\Library\mingw-w64\bin
E:\environment\Anaconda3\Library\usr\bin

简要说明五条路径的用途:这五个环境变量中,1 是 Python 需要,2 是 conda 自带脚本,3 是 jupyter notebook 动态库, 4 是使用 C with python 的时候

        新建完成后点击确定。

        (4)验证

           打开 cmd,在弹出的命令行查看 anaconda 版本,依次输入 :

conda --version
python --version

        若各自出现版本号,即代表配置成功。

        在开始菜单或桌面找到 Anaconda Navifator 将其打开(若桌面没有可以发一份到桌面,方便后续使用),出现 GUI 界面即为安装成功。

        Anaconda 自带了一些常用的机器学习库,如 numpy、pandas、matplotlib、seaborn、scikit-learn 等。

        如果需要安装其他库,可以直接在 Anaconda Navigator 里搜索安装。

        (5)更改conda源

        如果你没有魔法上网工具,建议更改 conda 源,这样可以加快下载包的速度。清华大学提供了 Anaconda 的镜像仓库,我们把源改为清华大学镜像源。

        找到 Anaconda prompt,打开 shell 面板。

        在命令行输入以下命令:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes

        查看是否修改好通道:

conda config --show channels

二、PyCharm使用

1、新建项目

2、配置conda环境

        (1)我们在PyCharm中依此选择File–>Settings–>Project–>Python Inerpreter,如下图所示:

        (2)在弹出的设置窗口中,点击左侧的“Python Inerpreter”,然后点击右侧的“Add Local Interpreter”,点击它进到环境配置窗口:

        (3)点击conda environment选项卡,点击右侧文件夹图标,找到自己anaconda下载的目录,选择anaconda根目录下的Scripts下的conda.exe。

        (4)然后点击“Load Environment”加载环境,加载完成后发现所有虚拟环境均导入,默认为base环境。

        (5)我们可以看到base环境的包,含有scikit-learn库,说明此时编译器可以进行sickit-learn库提供的相关操作。

        (6)验证是否配置成功,新建一个py文件,将下面的代码放进文件运行,若控制台正常运行出结果证明配置成功。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier# 1.获取数据
iris = load_iris()# 2.数据基本处理
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)# 3.特征工程 - 特征预处理
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)# 4.机器学习-KNN
# 4.1 实例化一个估计器
estimator = KNeighborsClassifier()
# 4.2 模型调优 -- 交叉验证,网格搜索
param_grid = {"n_neighbors": [1, 3, 5, 7]}
estimator = GridSearchCV(estimator, param_grid=param_grid, cv=5)
# 4.3 模型训练
estimator.fit(x_train, y_train)# 5.模型评估
# 5.1 预测值结果输出
y_pre = estimator.predict(x_test)
print("预测值是:\n", y_pre)
print("预测值和真实值的对比是:\n", y_pre == y_test)
# 5.2 准确率计算
score = estimator.score(x_test, y_test)
print("准确率为:\n", score)
# 5.3 查看交叉验证,网格搜索的一些属性
print("在交叉验证中,得到的最好结果是:\n", estimator.best_score_)
print("在交叉验证中,得到的最好的模型是:\n", estimator.best_estimator_)
print("在交叉验证中,得到的模型结果是:\n", estimator.cv_results_)print("Hello, sklearn!")

三、常用Anaconda指令

在没有 GUI 的情况下,以下命令比较常用:

1.查看当前环境下安装的库:

conda list

2.查看所有环境:

conda info --envs

3.创建新的环境:

conda create -n 环境名称 python=版本号

4.激活环境:

conda activate 环境名称

5.退出环境:

conda deactivate

6.删除环境:

conda remove -n 环境名称 --all

7.导出环境:

conda env export > environment.yaml

8.导入环境:

conda env create -f environment.yaml

9.列出所有可用的包:

conda search 包名

10.安装包:

conda install 包名

11.更新包:

conda update 包名

12.卸载包:

conda uninstall 包名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/921435.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/921435.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RAG提示词(日本語版)

RAG提示词(日本語版) System Message # 知能型質問応答アシスタント(RAGシステムプロンプト)## 役割定義 あなたは「知能型質問応答アシスタント」として、提供されたコンテキスト情報に基づいてユーザーの質問に回答する専門的な…

qData 数据中台【开源版】发布 1.0.5 版本,全面提升规则治理、非结构化数据处理与部署体验

2025年9月3日 —— 企业级开源数据中台 qData 开源版 正式发布 1.0.5 版本。本次更新聚焦 规则治理一体化、非结构化数据支持、以及开源版的体验与部署优化,进一步提升规则复用能力、数据接入广度与运维效率,帮助企业和开发者更轻松地构建高质量数据治理…

RecSys:用户行为序列建模以及DIN、SIM模型

引言 在推荐系统中,用户历史行为序列是极其重要的信息源。用户最近的点击、点赞、收藏、转发等行为能够有效反映其即时兴趣,无论是在召回、粗排还是精排阶段,合理利用这些行为序列都能显著提升推荐效果。本文将系统介绍用户行为序列建模的几…

QGIS二次开发01:环境配置-OSGeo4W镜像

写在前面: 本笔记根据多方资料整理而成,旨在为QGIS二次开发提供学习参考。内容仅供交流学习,欢迎共同探讨。 一、关于QGIS QGIS 是一个功能强大的桌面GIS软件本身,为用户提供了图形化界面(GUI)来进行地图制…

对接旅游行业安全需求:旅游安全急救实训室的功能构建与育人目标

随着我国旅游行业的快速发展,游客安全需求日益凸显,安全应急处置能力已成为旅游服务人才的核心竞争力。旅游安全急救实训室作为旅游服务与管理专业中的重要教学场所,其功能构建与育人目标影响人才培养质量与行业安全水平。点击获取方案 一、行…

Typora处理markdown文件【给.md文档加水印】

①文件→偏好设置→外观→打开主题文件夹②在打开的文件夹中放入水印图像③右键点击github.css文件后,点击编辑,进入编辑页面④将代码块中内容粘贴到文件最后 更多效果请自行探索 #write::before {content: "CSDN果子当夜宵:bigxie.blog…

基于单片机的六足机器人控制系统设计

基于单片机的六足机器人控制系统设计摘 要本设计主要是基于单片机的六足机器人控制系统设计,综合分析六足机器人的结构、步态和控制算法,结合云端服务器、WIFI 技术、蓝牙技术、语音识别技术和手势识别技术进行多种控制模式的设计,并提出不同…

RK3568 Trust

文章目录1、环境介绍2、前言3、ARM TrustZone3.1、什么是ARM TrustZone3.2、cpu特权等级3.3、ARM Trusted Firmware4、Rockchip 平台的 Trust4.1、实现机制4.2、启动流程4.3、生命周期4.4、Trust 编译打包流程分析5、总结1、环境介绍 硬件:飞凌ok3568-c开发板 软件…

C语言数据结构——详细讲解《二叉树与堆的基本概念》

C语言数据结构——详细讲解《二叉树与堆的基本概念》前言一、树的基础概念1.1 为什么需要树?1.2 树的定义与结构1.3 树的核心术语1.3 树的核心术语1.4 树的表示方法(孩子兄弟表示法)结构定义为什么用孩子兄弟表示法?1.5 树的实际应…

STAR-CCM+|雷诺数回顾

【1】引言 前序已经学习了K-epsilon湍流模型溯源的基础知识,今天再学习一些更为基础的知识,回顾一下雷诺数ReReRe。 【2】雷诺数定义 雷诺数公式为: ReρvDμRe\frac{\rho vD}{\mu}ReμρvD​ 式中, ρ\rhoρ——流体密度&…

Java中的死锁

锁的合理使用能够保证共享数据的安全性,但是 使用不当也会可能引起死锁。1. 死锁概念 死锁是指两个或两个以上的线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力干涉那它们都将无法推进下去,如果系统资源充足,进程的资源请求…

基于STM32F103C8T6的智能家居健康环境监测系统

项目开发背景 随着城市化进程加速和居民生活水平提升,人们对家居环境健康与安全的需求日益增强。现代住宅常因装修材料、密闭空间及外部污染导致甲醛超标、PM2.5浓度升高、温湿度失衡等问题,长期暴露此类环境中易引发呼吸道疾病、过敏反应等健康隐患。传…

2025职场进阶:B端产品经理必备的计算机专业技能精要

当前企业级服务市场竞争日益激烈,2025年的B端产品经理不仅需要深厚的行业认知,还必须具备扎实的计算机专业技能,才能设计出真正符合技术趋势与业务需求的企业级产品。而其中,人工智能技术已经成为B端产品不可或缺的组成部分&#…

有效三角形的个数(数组单调性)

目录 一:题目链接 二:题目思路 三:代码实现 一:题目链接 题目的要求是找出当前数组能组成三角形三元组的个数。 二:题目思路 有一种暴力枚举解法,利用三层 for 循环来一一枚举三元组的情况,如…

Rust在医疗系统中的应用:安全、性能与合规性实践(上)

Rust在医疗系统中的应用:安全、性能与合规性实践 摘要 医疗系统对软件安全与性能存在严苛双重需求,既需抵御内存漏洞、数据加密风险等安全威胁(如历史医疗设备因软件问题召回案例所示),又需满足电子健康记录(EHR)系统、医学影像处理等高并发数据场景的性能要求,同时需…

读写锁 shared_mutex 共享互斥量介绍

文章目录读数据对数据没有影响,为什么还需要shared_mutex1. 保证读取数据的“一致性”和“时效性”2. 协调“读”与“写”的竞争关系总结好的,我们来详细介绍 C17 中的 std::shared_mutex(共享互斥量,俗称读写锁)的使用…

Nestjs框架: 基于装饰器与Guards的完成RBAC权限系统设计与实现

概述 在现代权限管理系统中,RBAC(基于角色的访问控制)是广泛采用的一种模型RBAC 核心思想是通过角色来管理用户权限通过角色绑定用户、资源和权限,实现细粒度的访问控制为了实现这一目标,我们需要在数据库中设计合理的…

机器学习如何精准预测高值

一、概念理解“机器学习对于高值的预测保守”,这是建模里很常见的现象,尤其在生态、气候、遥感这类数据分布高度偏斜的场景。通常可以从以下几个角度理解:1. 数据分布与样本稀缺在训练集里,高值样本往往非常少,远低于中…

蜂窝物联网模组:智能门禁产品上的关键部件

随着物联网技术的快速发展,蜂窝物联网模组正逐步成为智能门禁系统的关键通信组件。蜂窝模组凭借其广覆盖、高可靠性和低功耗特性,正从传统门禁系统的补充角色转变为智能门禁的核心通信组件,尤其在智慧社区、商业楼宇和政府机构等场景中展现出…

[光学原理与应用-417]:非线性光学 - 线性光学(不引发频率的变化)与非线性光学(引发频率变化)的异同

一、定义与物理机制:线性响应 vs 非线性响应线性光学定义:光与物质相互作用时,介质的极化强度与入射光电场强度呈线性关系(Pϵ0​χ(1)E),输出光强与输入光强成正比(Iout​∝Iin​)-…