集成算法(聚类)

下面简单集成算法代码

from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# 创建数据集,生成 3 个中心的聚类数据,共 300 个样本,每个样本 2 个特征
X, _ = make_blobs(n_samples=300, centers=3, n_features=2, random_state=42)

# 进行 K 均值聚类,设置聚类数为 3
kmeans = KMeans(n_clusters=3, random_state=42)
y_pred = kmeans.fit_predict(X)

# 可视化聚类结果
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], 
s=300, c='red', marker='*', label='Centroids')
plt.legend()
plt.title('K-Means Clustering')
plt.show()

这段代码展示了如何使用scikit-learn库实现K均值(K-Means)聚类算法,并通过可视化呈现聚类结果。

首先是数据生成环节。代码利用make_blobs函数创建了一个模拟数据集,其中参数n_samples=300指定生成300个样本,centers=3定义了数据潜在的3个聚类中心,n_features=2设置每个样本包含2个特征(便于二维可视化),random_state=42确保结果可重复。生成的数据集X是一个300行2列的数组,包含了分布在3个中心周围的样本点,由于未使用标签信息,该过程属于无监督学习的数据准备。

接下来是K均值聚类的实现。通过KMeans类初始化模型,n_clusters=3指定聚类数量为3(与数据生成时的中心数一致),random_state=42固定随机种子以保证结果稳定。调用fit_predict方法同时完成模型训练和预测,返回的y_pred是长度为300的数组,每个元素表示对应样本所属的聚类类别(0、1或2),实现了对无标签数据的自动分组。

最后是结果可视化部分。使用matplotlib.pyplot绘制散点图:以样本的两个特征分别作为横、纵轴,用c=y_pred通过不同颜色区分聚类结果,cmap='viridis'设置配色方案;同时用红色星号标记出聚类中心(kmeans.cluster_centers_存储了3个中心的坐标),并通过s=300放大显示以突出其位置。图表添加了图例、标题,最终通过plt.show()展示图像。

从结果来看,可视化图像会清晰呈现3组颜色不同的样本点,每组点围绕一个红色星号(聚类中心)分布,直观体现了K均值算法的核心思想——通过迭代计算,将数据划分为K个聚类,使每个样本到其所属聚类中心的距离之和最小化。此案例中,由于使用了预设3个中心的模拟数据,聚类结果通常会与真实分布高度吻合,验证了K均值在简单数据集上的有效性。该代码为理解无监督聚类算法提供了直观示例,可通过调整n_clusters等参数观察不同聚类数量对结果的影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/96743.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/96743.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

01 网络信息内容安全--绪论

1 课程内容 网络信息内容获取技术网络信息内容预处理技术网络信息内容过滤技术社会网络分析技术入侵检测技术异常流量检测技术对抗攻击技术 2 理论研讨 分为16个组 2.1 网络信息内容获取技术:第1组 【用DeepSeek网站爬虫,数据获取零成本&#xff01…

GPT-5:天变了吗?还是风停了?

2025年8月8日,OpenAI 发布了 GPT-5。这次更新被许多人寄予厚望,也引发了不少争议。对普通用户来说,这是一场“又快又会做事”的智能盛宴;而对资深开发者和 AI 研究者而言,GPT-5 可能更像是一次不够激进、略显保守的版本…

生信分析自学攻略 | R语言数据筛选和修改

在《生信小白自学攻略》系列的前几篇文章中,我们已经了解了 R 和 RStudio 的安装、RStudio 的深度探索,以及 R 语言的基本数据类型和数据结构。现在,是时候深入探讨如何运用 R 语言对数据进行精细化处理了。本篇推文将详细介绍如何在 R 中对数…

从零开始学习概念物理(第13版)(1)

前言:对我来说,最有用的就是物理了,尤其是电磁学。但是要学好它,我得夯实我的基础,前面更加基础的数学和物理都不能拉下。现在我问了Deepseek推荐的国外物理书,这本《概念物理》是最适合我,等入…

CSS变量

元素背景需要统一,一个个设置修改起来很麻烦,也没有全局变量? CSS中的变量_css变量-CSDN博客 -- 前缀定义变量,var(--) 使用变量,:root 表示根元素。 :root { --bg:#222; --fg:#bbb; } body { background:var(--bg)…

C++(Qt)软件调试---vscode配置clang-tidy静态分析(30)

C(Qt)软件调试—vscode配置clang-tidy静态分析(30) 文章目录C(Qt)软件调试---vscode配置clang-tidy静态分析(30)[toc]1 概述2 clang-tidy基本用法3 目前已有检查项4 vscode配置clang-tidy5 .clang-tidy配置文件6 参考地址更多精彩…

每天自动备份oracle

oracle数据库比其他数据库都贵,但是自带的管理工具却很差,真不知道咋想的。想完成每天自动备份,只能自己动手(window环境):1、创建个备份目录,如D:\databack2、创建个脚本:backup.bat核心内容如下&#xff…

HBase Coprocessor:扩展HBase功能的利器

HBase Coprocessor:扩展HBase功能的利器 关键词:HBase, Coprocessor, 协处理器, RegionServer, 分布式计算, 扩展功能, 二级索引 摘要:HBase作为Hadoop生态中的分布式列存储数据库,以高可靠性、高吞吐量和强一致性著称&#xff0c…

【Java后端】Spring Boot 实现请求设备来源统计与UA解析全攻略

Spring Boot 实现请求设备来源统计与UA解析全攻略 在 Web 应用的实际场景中,我们经常需要知道 请求来自哪里 —— 是 Android 手机?还是 iOS?或者是 PC 浏览器? 这类信息往往可以通过 User-Agent (UA) 来统计,进而帮助…

技术框架搭建:支撑竞拍全流程

纯竞拍的技术框架是一个多层协同的系统,从用户交互到数据处理,每个环节都有专门的技术组件提供支持。​前端层是用户与竞拍系统交互的窗口,核心目标是提供流畅、实时、直观的操作体验。采用 React、Vue 等主流前端框架构建单页应用&#xff0…

2025.8.18-2025.8.24第34周:有内耗有挣扎

🌟 本周完成的3件亮点事情(可具体写过程): openvla debug起来了把上周的演讲视频发给了导师,人家帮我提了很多建议。罗永浩,李想4小时访谈看完了即兴演讲开始不内耗,直接讲,这样才能…

点播视频预览是怎么做到的?

看进度条上的小窗口,你有没有想过,哔哩哔哩是如何在进度条上显示视频预览的? 这个功能非常有用,尤其是在播放长视频时。 如何才能实现? 实现这一点有三种方法。 预先为视频生成 CSS sprites,并通过 API 获取预先为视频生成 W…

prometheus监控kubernetes集群并使用 grafana展示数据

目录 Prometheus组成及架构 prometheus核心组件 1.Prometheus Server 2.Exporters 3.Alertmanager 4.Pushgateway 数据流程 在k8s中部署PrometheusGrafana钉钉告警邮件告警 将kube-Prometheus包下载后传入虚拟机 tar -xzv kube-promethus.zip cd 进入 ll 显示目录 …

K8s 实战:Pod 版本更新回滚 + 生命周期管控

一、版本更新与回滚实验背景本实验通过 Kubernetes 的 Deployment 资源演示应用的版本更新与回滚流程。Deployment 是 Kubernetes 中用于管理 Pod 和 ReplicaSet 的核心资源,支持滚动更新(避免服务中断)和版本回滚(应对更新故障&a…

静电服漏检率↓79%!陌讯多模态识别算法在智慧安检的实战解析

​原创声明​​:本文技术方案引自《陌讯视觉算法技术白皮书V3.1》,实测数据来自工业场景部署验证 一、行业痛点:静电防护失效的隐形风险 据《电子制造业安防报告2025》统计,精密电子车间因静电服穿戴不规范导致的次品率高达23%&a…

StarRocks不能启动 ,StarRocksFe节点不能启动问题 处理

StarRocks不能启动 ,StarRocksFe节点不能启动问题 处理 问题描述 mysql:[Warning] Using a passwordon the command line interface can be insecureERROR 2003 (HYa00): Can’t connect to MysoL server on ‘192.168.5.128:9030’(111)Error: failed to query fE…

麒麟系统播放图片 速度比较

pygame效果比opencv好,opencv有锯齿:import pygame import os import timedef show_image_sdl(image_path):"""使用SDL2快速显示图片"""# 初始化pygamepygame.init()# 获取屏幕信息info pygame.display.Info()screen_wid…

复杂场景横幅识别准确率↑91%!陌讯多模态融合算法在智慧园区的实战解析

一、行业痛点:园区违规横幅识别的三重挑战 据《2024智慧园区安防报告》(来源:CCSA TC10)统计: ​​强光干扰​​:玻璃幕墙反光导致文字识别错误率超50% ​​形变干扰​​:横幅褶皱、飘动造成关…

Mybatis Plus - 代码生成器简单使用

1.引入依赖<dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version>3.5.12</version></dependency><dependency><groupId>com.baomidou</groupId><ar…

vue2腾讯地图点击地图获取地址经纬度web

注意&#xff1a;&#xff01;&#xff01;&#xff01;在做uniapp小程序导航功能时&#xff0c;拿到我们在后台管理设置的经纬度&#xff0c;根据经纬度去导航到店的时候&#xff0c;最好用腾讯地图来获取经纬度&#xff0c;uniapp小程序那边默认导航经纬度是腾讯系的&#xf…