Python 实现桶排序详解

1. 核心原理

桶排序是一种非比较型排序算法,通过将数据分配到多个“桶”中,每个桶单独排序后再合并。其核心步骤包括:

  • 分桶:根据元素的范围或分布,将数据分配到有限数量的桶中。
  • 桶内排序:对每个非空桶内的数据进行排序(通常使用插入排序等简单算法)。
  • 合并结果:按桶的顺序将数据合并回原数组。

关键特点

  • 适用于数据分布均匀且范围已知的场景。
  • 时间复杂度依赖数据分布,理想情况下接近线性。
  • 属于**“空间换时间”**的排序策略。

2. 时间复杂度与空间复杂度

维度

说明

最好情况

O(n)(数据均匀分布,每个桶元素数量均衡)

平均情况

O(n + k),k为桶数量(若每个桶内用O(n²)排序,则为O(n + n²/k))

最坏情况

O(n²)(所有数据集中在一个桶内)

空间复杂度

O(n + k)(需要额外存储桶和桶内数据)

3. 适用场景

推荐场景

不推荐场景

- 数据均匀分布

- 数据分布极度不均

- 数据范围已知

- 内存严格受限

- 外部排序(如大数据)

- 数据范围未知或动态变化

- 需要稳定排序

- 对空间效率要求高

4. 代码实现(Python)

以下是将范围 [0, 100) 的整数分为10个桶的示例:

def bucket_sort(arr, bucket_size=10):if len(arr) == 0:return arr# 1. 计算数据范围min_val, max_val = min(arr), max(arr)bucket_count = (max_val - min_val) // bucket_size + 1buckets = [[] for _ in range(bucket_count)]# 2. 分桶for num in arr:idx = (num - min_val) // bucket_sizebuckets[idx].append(num)# 3. 桶内排序(此处使用内置排序,实际可用插入排序)sorted_arr = []for bucket in buckets:sorted_arr.extend(sorted(bucket))  # 稳定排序需保持插入顺序return sorted_arr# 示例调用
arr = [29, 25, 3, 49, 9, 37, 21, 43]
sorted_arr = bucket_sort(arr)
print("排序结果:", sorted_arr)  # 输出: [3, 9, 21, 25, 29, 37, 43, 49]

5. 分桶过程示例

假设输入数组为 [29, 25, 3, 49, 9, 37, 21, 43],最小值为3,最大值为49,桶大小为10:

  1. 计算桶数量(49 - 3) // 10 + 1 = 5个桶(范围分别为3-12, 13-22, 23-32, 33-42, 43-52)。
  2. 分桶结果
    • Bucket 0 (3-12): [3, 9]
    • Bucket 1 (13-22): [21]
    • Bucket 2 (23-32): [29, 25]
    • Bucket 3 (33-42): [37]
    • Bucket 4 (43-52): [49, 43]
  3. 桶内排序
    • Bucket 0 → [3, 9]
    • Bucket 1 → [21]
    • Bucket 2 → [25, 29]
    • Bucket 3 → [37]
    • Bucket 4 → [43, 49]
  4. 合并结果[3, 9, 21, 25, 29, 37, 43, 49]

6. 优化策略

  • 动态调整桶大小:根据数据分布自动调整桶的数量和范围。
  • 混合排序算法:对小桶使用插入排序,对大桶递归使用桶排序。
  • 处理重复元素:使用计数排序优化含大量重复值的数据。

7. 对比其他排序算法

维度

桶排序

快速排序

归并排序

排序类型

非比较排序

比较排序

比较排序

稳定性

是(若桶内排序稳定)

最佳场景

均匀分布数据

通用随机数据

链表/外部排序

空间开销

高(需额外桶空间)

低(递归栈)

高(合并需额外数组)

8. 总结

桶排序在数据均匀分布且范围已知时效率极高,但需权衡空间开销。适用于大规模数据、外部排序及特定场景(如浮点数排序)。实际应用中需结合数据特点调整分桶策略,以平衡时间与空间效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/82650.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

brep2seq 论文笔记

Brep2Seq: a dataset and hierarchical deep learning network for reconstruction and generation of computer-aided design models | Journal of Computational Design and Engineering | Oxford Academic 这段文本描述了一个多头自注意力机制(MultiHead Attenti…

在 LangGraph 中集成 Mem0 记忆系统教程

简介 LangGraph 是一个强大的对话流程编排框架,而 Mem0 则是一个高效的记忆系统。本教程将介绍如何将两者结合,创建一个具有记忆能力的客服助手系统。 环境准备 首先安装必要的依赖: pip install langgraph mem0 langchain openai基础配置…

ceph 报错 full ratio(s) out of order

full ratio(s) out of order你遇到的错误信息: full ratio(s) out of order说明你设置的 OSD 空间使用阈值之间的数值顺序不正确,即: nearfull_ratio ≤ backfillfull_ratio ≤ full_ratio ≤ osd_failsafe_full_ratio如果它们的关系不满足这个顺序,Ceph 就会报这个错误。…

NB-IoT NPUSCH(三)-资源映射

资源映射单独做一章节,是因为NPUSCH的资源映射比较复杂。与LTE不同,为了提高数据传输的质量,NB-IoT的数据会有重复传输。NPUSCH一开始生成的TBS只与子载波个数、RU个数有关,与重复次数没有关系。初始产生的数据为 个时隙&#xff…

华为OD机试真题——荒岛求生(2025B卷:200分)Java/python/JavaScript/C/C++/GO最佳实现

2025 B卷 200分 题型 本专栏内全部题目均提供Java、python、JavaScript、C、C++、GO六种语言的最佳实现方式; 并且每种语言均涵盖详细的问题分析、解题思路、代码实现、代码详解、3个测试用例以及综合分析; 本文收录于专栏:《2025华为OD真题目录+全流程解析+备考攻略+经验分…

centos7安装MySQL(保姆级教学)

在 Linux 系统的软件管理中,YUM(Yellowdog Updater, Modified)包管理器是不可或缺的工具,而 YUM 源的选择与配置直接影响着软件安装与更新的效率。本文将深入解析网络 YUM 源的分类,详细介绍如何使用知名平台提供的 YU…

DeepSeek 赋能教育游戏化:AI 重构学习体验的技术密码

目录 一、引言:教育游戏化与 DeepSeek 的相遇二、DeepSeek 技术剖析2.1 核心架构2.2 关键技术 三、教育游戏化设计的奥秘3.1 概念与意义3.2 常见方法与元素3.3 成功案例借鉴 四、DeepSeek 在教育游戏化设计中的多面应用4.1 个性化学习路径打造4.2 智能教学辅助工具4…

WPF命令与MVVM模式:打造优雅的应用程序架构

🎮 打造优雅的应用程序架构 1. 🧩 命令系统基础1.1 🤔 为什么需要命令?1.2 🏗️ ICommand接口1.3 🛠️ 实现基本命令2. 🏛️ MVVM模式详解2.1 🧱 MVVM三大组件2.2 🏗️ 创建ViewModel基类2.3 🎯 典型ViewModel示例3. 🧩 命令绑定实战3.1 🎨 View中的命令…

真实案例拆解:智能AI客服系统中的两类缓存协同

真实案例拆解:智能客服系统中的两类缓存协同 在AI客服系统中,“响应速度”与“语义准确性”是一对天然的矛盾体。为了实现秒级应答与智能理解的双重目标,系统需要在技术架构中融合精确命中的缓存系统(如Redis)与模糊语义识别的向量数据库(如Milvus)。这两种能力的结合,…

FastAPI与MongoDB分片集群:异步数据路由与聚合优化

title: FastAPI与MongoDB分片集群:异步数据路由与聚合优化 date: 2025/05/26 16:04:31 updated: 2025/05/26 16:04:31 author: cmdragon excerpt: FastAPI与MongoDB分片集群集成实战探讨了分片集群的核心概念、Motor驱动配置技巧、分片数据路由策略、聚合管道高级应用、分片…

一起学数据结构和算法(三)| 字符串(线性结构)

字符串(String) 字符串是由字符组成的有限序列,在计算机中通常以字符数组形式存储,支持拼接、查找、替换等操作。 简介 字符串是计算机科学中最常用的数据类型之一,由一系列字符组成的有限序列。在大多数编程语言中&…

2025电工杯数学建模竞赛A题 光伏电站发电功率日前预测问题 保姆级教程讲解|模型讲解

完整内容请看文章最下面的推广群 2025电工杯数学建模竞赛 A题保姆级分析完整思路代码数据教学 2025电工杯 A题保姆级教程思路分析 DS数模-全国大学生电工数学建模(电工杯) A题保姆级教程思路分析 A题:光伏电站发电功率日前预测问题 下面我…

React Native 拼音及拼音首字母搜索组件开发

写在前面 “用户说找不到联系人?拼音搜索功能必须安排上!” —— 当产品经理第N次提出这个需求时,我意识到需要开发一个强大的拼音搜索组件。本文将详细介绍如何开发一个支持拼音匹配、首字母搜索的React Native搜索组件,让你的应…

springboot--实战--大事件--用户接口开发

开发模式&环境搭建 开发模式: 前后端分离开发 前端程序员写前端页面,后端程序员写后端的接口,前端工程发送请求来访问后台,后台处理完请求后要给前端相应对应的数据。 还需要一套标准来约束即接口文档,在接口文…

html使用JS实现账号密码登录的简单案例

目录 案例需求 思路 错误案例及问题 修改思路 案例提供 所需要的组件 <input>标签&#xff0c;<button>标签&#xff0c;<script>标签 详情使用参考&#xff1a;HTML 教程 | 菜鸟教程 案例需求 编写一个程序&#xff0c;最多允许用户尝试登录 3 次。…

小米玄戒O1架构深度解析(一):十核异构设计与缓存层次详解

前言 这两天&#xff0c;小米的全新SOC玄戒O1横空出世&#xff0c;引发了科技数码圈的一次小地震&#xff0c;那么小米的这颗所谓的自研SOC&#xff0c;内部究竟有着什么不为人知的秘密呢&#xff1f;我们一起一探究竟。 目录 前言1 架构总览1.1 基本构成1.2 SLC缺席的原因探…

VSCode如何像Pycharm一样“““回车快速生成函数注释文档?如何设置文档的样式?autoDocstring如何设置自定义模板?

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 让VSCode拥有PyCharm级注释生成能力 📒🚀 实现方案🛠️ 备用方案📒 自定义注释文档格式样式 📒🔄 切换主流注释风格✨ 深度自定义模板🛠️ 类型提示与注释联动优化⚓️ 相关链接 ⚓️📖 介绍 📖 用PyCharm写P…

数据库的事务(Transaction)

在数据库中&#xff0c;事务&#xff08;Transaction&#xff09; 是保证数据操作一致性和完整性的核心机制。它通过一组原子性的操作单元&#xff0c;确保所有操作要么全部成功&#xff08;提交&#xff09;&#xff0c;要么全部失败&#xff08;回滚&#xff09;。以下是数据…

2025-05-27 Python深度学习7——损失函数和反向传播

文章目录 1 损失函数1.1 L1Loss1.2 MSELoss1.3 CrossEntropyLoss 2 反向传播 本文环境&#xff1a; Pycharm 2025.1Python 3.12.9Pytorch 2.6.0cu124 1 损失函数 ​ 损失函数 (loss function) 是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的"风险&…

python+tkinter实现GUI界面调用即梦AI文生图片API接口

背景 目前字节跳动公司提供了即梦AI的接口免费试用&#xff0c;但是并发量只有1&#xff0c;不过足够我们使用了。我这里想做个使用pythontkinter实现的GUI可视化界面客户端&#xff0c;这样就不用每次都登录官方网站去进行文生图片&#xff0c;当然文生视频&#xff0c;或者图…