Python 字典(dict)的高级用法与技巧

今天我们继续深入讲解 Python 字典的 高级用法与技巧,包括:

  1. defaultdict:带默认值的字典
  2. Counter:快速统计工具
  3. 字典排序:按键或值排序
  4. 合并字典(传统方式和 Python 3.9+ 新语法)
  5. 嵌套字典的安全访问

collections.defaultdict:自动创建默认值

来自 collections 模块的 defaultdict 是一种可以在访问不存在的 key 时自动生成默认值的字典。

使用方式:

from collections import defaultdict# 默认值为 int(),即 0
counts = defaultdict(int)words = ['apple', 'banana', 'apple']
for word in words:counts[word] += 1print(counts)  # {'apple': 2, 'banana': 1}

常见场景:

  • 统计频率(用 int 作为默认工厂)
  • 创建嵌套字典(用 dictdefaultdict
  • 列表自动追加(用 list
# 嵌套字典
tree = defaultdict(lambda: defaultdict(int))
tree["fruit"]["apple"] += 1# 值为列表
group = defaultdict(list)
group["math"].append("Alice")
group["math"].append("Bob")

collections.Counter:频率统计神器

用于快速统计元素出现次数。

from collections import Counterdata = ['apple', 'banana', 'apple', 'orange', 'banana']
count = Counter(data)print(count)          # Counter({'apple': 2, 'banana': 2, 'orange': 1})
print(count['apple']) # 2

方法:

count.most_common(2)     # [('apple', 2), ('banana', 2)]
count.update(['apple'])  # 再加一个 'apple'

字典排序(按 key / value)

字典本身是无序(3.6 之后有序表现,但不用于排序),你可以使用 sorted() 对字典内容排序:

按值排序:

d = {'a': 3, 'b': 1, 'c': 2}
sorted_items = sorted(d.items(), key=lambda item: item[1])print(dict(sorted_items))  # {'b': 1, 'c': 2, 'a': 3}

按键排序:

sorted_by_key = dict(sorted(d.items(), key=lambda x: x[0]))

合并字典的方法

Python < 3.9:

a = {'x': 1, 'y': 2}
b = {'y': 3, 'z': 4}
merged = {**a, **b}  # 若键冲突,b 会覆盖 a

Python ≥ 3.9 新写法:

a = {'x': 1}
b = {'y': 2}
c = a | b  # 合并

安全访问嵌套字典

防止 KeyError 的方式:

person = {"name": "Alice","address": {"city": "Beijing","code": 10001}
}# 安全访问嵌套值
city = person.get("address", {}).get("city", "Unknown")

补充:创建嵌套字典的 defaultdict 技巧

nested = defaultdict(lambda: defaultdict(list))
nested["class"]["math"].append("Alice")

下面通过两个实战小项目,深入掌握 Counterdefaultdict 的应用技巧:


项目一:使用 Counter 实现词频统计器(英文)

目标:读取一段文本,统计其中每个单词出现的次数,并输出出现频率最高的前 N 个单词。

示例代码:

from collections import Counter
import redef word_count(text, top_n=10):# 使用正则将文本中的单词提取出来(忽略大小写)words = re.findall(r'\b\w+\b', text.lower())# 用 Counter 统计频率counter = Counter(words)# 输出前 N 个高频词for word, freq in counter.most_common(top_n):print(f"{word}: {freq}")# 示例用法
text = """
Natural language processing (NLP) is a subfield of linguistics, computer science, and artificial intelligence 
concerned with the interactions between computers and human language.
"""word_count(text, top_n=5)

输出示例:

and: 3
language: 2
natural: 1
processing: 1
nlp: 1

项目二:使用 defaultdict 构建嵌套 JSON-like 数据结构

目标:自动构建一个部门 -> 课程 -> 学生列表 的嵌套结构。

示例代码:

from collections import defaultdict
import json# 三层嵌套 defaultdict
school = defaultdict(lambda: defaultdict(list))# 添加数据
school["Engineering"]["Math"].append("Alice")
school["Engineering"]["Math"].append("Bob")
school["Engineering"]["Physics"].append("Charlie")
school["Arts"]["Literature"].append("Daisy")# 可转为普通 dict 方便输出
def convert(d):if isinstance(d, defaultdict):d = {k: convert(v) for k, v in d.items()}return d# 打印嵌套 JSON 样式
print(json.dumps(convert(school), indent=2))

输出示例:

{"Engineering": {"Math": ["Alice","Bob"],"Physics": ["Charlie"]},"Arts": {"Literature": ["Daisy"]}
}

总结

工具用途优势
Counter快速统计元素频率简洁、可排序、可更新
defaultdict自动初始化默认值,构建嵌套结构不必手动判断 key 是否存在

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/86041.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

动静态库的使用(Linux)

1.库 通俗来说&#xff0c;库就是现有的&#xff0c;可复用的代码&#xff0c;例如&#xff1a;在C/C语言编译时&#xff0c;就需要依赖相关的C/C标准库。本质上来说库是一种可执行代码的二进制形式&#xff0c;可以被操作系统载入内存执行。通常我们可以在windows下看到一些后…

R²ec: 构建具有推理能力的大型推荐模型,显著提示推荐系统性能!!

摘要&#xff1a;大型推荐模型通过编码或项目生成将大型语言模型&#xff08;LLMs&#xff09;扩展为强大的推荐工具&#xff0c;而近期在LLM推理方面的突破也同步激发了在推荐领域探索推理的动机。目前的研究通常将LLMs定位为外部推理模块&#xff0c;以提供辅助性思考来增强传…

【Java后端基础 005】ThreadLocal-线程数据共享和安全

&#x1f4da;博客主页&#xff1a;代码探秘者 ✨专栏&#xff1a;文章正在持续更新ing… ✅C语言/C&#xff1a;C&#xff08;详细版&#xff09; 数据结构&#xff09; 十大排序算法 ✅Java基础&#xff1a;JavaSE基础 面向对象大合集 JavaSE进阶 Java版数据结构JDK新特性…

Tesseract配置参数详解及适用场景(PyTesseract进行OCR)

在使用 PyTesseract 进行 OCR 时&#xff0c;合理配置参数是提高识别准确率的关键。以下是 Tesseract 常用参数的详细解释和适用场景。 一、关键参数 &#xff08;1&#xff09;页面分割模式&#xff08;Page Segmentation Mode, --psm&#xff09; 控制 Tesseract 如何分析…

【Zephyr 系列 12】BLE + NVS + 低功耗融合实战:打造可配置蓝牙信标系统

🧠关键词:Zephyr、BLE 广播、信标、NVS 参数、低功耗、状态机、周期唤醒 📌适合人群:希望实现 BLE 信标类产品(定位标签、资产管理)的开发者 📊预计篇幅:约 5200+ 字 🎯 项目目标 构建一个可广泛应用于资产标签、定位信标、设备标识等场景的蓝牙广播模块,具备:…

图解浏览器多进程渲染:从DNS到GPU合成的完整旅程

目录 浏览器进程架构的演化 进程和线程关系图示 进程&#xff08;Process&#xff09; 线程&#xff08;Thread&#xff09; 协程&#xff08;Coroutine&#xff09; 进程&线程&协程核心对比 单进程和多进程浏览器 单进程浏览器​编辑 单进程浏览器存在的问题…

Lombok 的 @Data 注解失效,未生成 getter/setter 方法引发的HTTP 406 错误

HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误&#xff0c;它们的含义、原因和解决方法都有显著区别。以下是详细对比&#xff1a; 1. HTTP 406 (Not Acceptable) 含义&#xff1a; 客户端请求的内容类型与服务器支持的内容类型不匹…

C# 类和继承(抽象成员)

抽象成员 抽象成员是指设计为被覆写的函数成员。抽象成员有以下特征。 必须是一个函数成员。也就是说&#xff0c;字段和常量不能为抽象成员。必须用abstract修饰符标记。不能有实现代码块。抽象成员的代码用分号表示。 例如&#xff0c;下面取自一个类定义的代码声明了两个抽…

基于JWT+SpringSecurity整合一个单点认证授权机制

基于 JWT Spring Security 的授权认证机制&#xff0c;在整体架构设计上体现了高度的安全性与灵活性。其在整合框架中的应用&#xff0c;充分展示了模块化、可扩展性和高效鉴权的设计理念&#xff0c;为开发者提供了一种值得借鉴的安全架构模式。 1.SpringSecurity概念理解 …

HarmonyOS运动开发:如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit&#xff08;传感器服务&#xff09;# 前言 在运动类应用中&#xff0c;运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据&#xff0c;如配速、距离、卡路里消耗等&#xff0c;用户可以更清晰…

Git 切换到旧提交,同时保证当前修改不丢失

在 Git 中&#xff0c;可以通过以下几种方式切换到之前的提交&#xff0c;同时保留当前的修改 1. 使用 git checkout 创建临时分离头指针&#xff08;推荐用于查看代码&#xff09; git checkout <commit-hash>这会让你进入"分离头指针"状态&#xff0c;你可…

东芝Toshiba DP-4528AG打印机信息

东芝 Toshiba DP 4528AG 是一款黑白激光数码复合机&#xff1a; 类型&#xff1a;激光数码复合机&#xff0c;涵盖复印、打印、扫描、传真功能&#xff0c;能满足办公室多样化的文档处理需求。速度类型&#xff1a;中速&#xff0c;黑白复印和打印速度可达 45 页 / 分钟&#…

Qt生成日志与以及捕获崩溃文件(mingw64位,winDbg)————附带详细解说

文章目录 Qt生成日志与以及报错文件(mingw64位&#xff0c;winDbg)0 背景与结果0.1 背景0.2 结果1 WinDbg1.1 安装1.2 使用 2 编写代码2.1 ccrashstack类2.2 编写输出捕获异常的dmp文件2.2 编写输出日志文件2.3 调用生成日志和dmp文件 参考 Qt生成日志与以及报错文件(mingw64位…

Nginx + Tomcat负载均衡群集

目录 一、案例环境 二、部署 Tomcat&#xff08;102/103&#xff09; 1、准备环境 &#xff08;1&#xff09;关闭firewalld 防火墙 &#xff08;2&#xff09;安装JDK 2、安装配置 Tomcat &#xff08;1&#xff09;Tomcat 的安装和配置 &#xff08;2&#xff09;移动…

三、元器件的选型

前言&#xff1a;我们确立了题目的功能后&#xff0c;就可以开始元器件的选型&#xff0c;元器件的选型关乎到我们后面代码编写的一个难易。 一、主控的选择 主控的选择很大程度上决定我们后续使用的代码编译器&#xff0c;比如ESP32使用的是VScode&#xff0c;或者Arduino&a…

API是什么意思?如何实现开放API?

目录 一、API 是什么 &#xff08;一&#xff09;API 的定义 &#xff08;二&#xff09;API 的作用 二、API 的类型 &#xff08;一&#xff09;Web API 1. RESTful API 2. SOAP API &#xff08;二&#xff09;操作系统 API &#xff08;三&#xff09;数据库 API …

AI生成的基于html+marked.js实现的Markdown转html工具,离线使用,可实时预览 [

有一个markdown格式的文档&#xff0c;手头只有notepad的MarkdownPanel插件可以预览&#xff0c;但是只能预览&#xff0c;不能直接转换为html文件下载&#xff0c;直接复制预览的内效果又不太好&#xff0c;度娘也能找到很多工具&#xff0c;但是都需要在线使用。所以考虑用AI…

Java-前置基础

前言 基础基础 package org.example;public class Main {int a 10;String s1 "你好";public static void main(String[] args) {System.out.println(a);System.out.println(s1);} } 发现报错位置 public class Main {static int a 10;static String s1 "你好…

python字符串方法

1. capitalize&#xff1a; 是第一个字符大写&#xff0c;其余小写 2. encode&#xff1a; 将字符串转换为字节串&#xff08;bytes&#xff09;&#xff0c;默认使用 UTF-8 编码。 3. format&#xff1a; format是 Python 中字符串对象的内置方法&#xff0c;语法为S.form…

Java详解LeetCode 热题 100(24):LeetCode 234. 回文链表(Palindrome Linked List)详解

文章目录 1. 题目描述1.1 链表节点定义 2. 理解题目2.1 回文链表的特征2.2 核心难点 3. 解法一&#xff1a;转换为数组法3.1 算法思路3.2 详细图解3.3 Java代码实现3.4 详细执行过程演示3.5 执行结果示例3.6 使用数组而非ArrayList的优化版本3.7 复杂度分析3.8 优缺点分析 4. 解…