（四）Python基础入门-核心数据结构

概览

列表操作（增删改查/切片/推导式）
元组特性与不可变性
字典操作（键值对/嵌套字典）
集合运算（交集/并集/差集）

Python的核心数据结构是编程的基石，本文将系统讲解列表、元组、字典和集合四大数据结构，包含详细的教学内容和实用示例。

一、列表：灵活的可变序列

列表是Python中最常用的数据结构，支持存储不同类型元素，并允许动态修改。

创建与基本操作

# 创建列表
fruits = ["apple", "banana", "cherry"]
numbers = [1, 3.14, True]  # 支持混合类型# 索引访问（正向从0开始，负向从-1开始）
print(fruits[0])   # "apple"
print(fruits[-1])  # "cherry"# 添加元素
fruits.append("orange")       # 末尾添加 ["apple", "banana", "cherry", "orange"]
fruits.insert(1, "mango")     # 指定位置插入 ["apple", "mango", "banana", "cherry", "orange"]# 删除元素
fruits.remove("banana")       # 按值删除
popped = fruits.pop(2)        # 按索引删除并返回被删元素
del fruits[0:2]               # 删除切片 ["cherry", "orange"]# 修改元素
fruits[0] = "kiwi"            # 直接赋值修改

切片操作详解

切片语法：
list[start:stop:step]

numbers = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]# 基础切片
print(numbers[2:5])    # [2, 3, 4]  索引2到5(不含5)
print(numbers[:3])     # [0, 1, 2]  从头开始
print(numbers[7:])     # [7, 8, 9]  直到末尾# 步长切片
print(numbers[::2])    # [0, 2, 4, 6, 8]  每隔一个取
print(numbers[1::2])   # [1, 3, 5, 7, 9]  奇数索引
print(numbers[::-1])   # [9, 8, 7, ...]   逆序列表# 切片复制
copy = numbers[:]      # 创建全新列表副本

列表推导式实战

列表推导式提供简洁高效的创建方式：

# 基础推导式
squares = [x**2 for x in range(10)]  # [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]# 条件过滤
even_squares = [x**2 for x in range(10) if x % 2 == 0]  # [0, 4, 16, 36, 64]# 嵌套推导式
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
flattened = [num for row in matrix for num in row]  # [1, 2, 3, 4, 5, 6, 7, 8, 9]# 带条件转换
grades = [85, 92, 78, 90, 65]
result = ["Pass" if score >= 70 else "Fail" for score in grades]  # ['Pass', 'Pass', 'Pass', 'Pass', 'Fail']

二、元组：不可变的守护者

元组与列表类似，但创建后不可修改，适合存储不应改变的数据。

创建与特性

# 创建元组
colors = ("red", "green", "blue")
coordinates = (40.7128, -74.0060)  # 经纬度数据# 单元素元组需加逗号
single = ("only",)  # 注意逗号
not_tuple = ("oops")  # 这实际是字符串# 解包赋值
x, y, z = colors  # x="red", y="green", z="blue"# 不可变性验证
try:colors[1] = "yellow"  # 尝试修改
except TypeError as e:print(f"错误：{e}")  # 'tuple' object does not support item assignment

元组的实际应用场景

# 1. 函数返回多个值
def get_dimensions():return 1920, 1080width, height = get_dimensions()# 2. 字典键值（列表不能作为键）
locations = {(35.6895, 139.6917): "Tokyo",(40.7128, -74.0060): "New York"
}# 3. 保护重要数据
CONFIG = ("admin", "secure_password", 8080)
# 后续无法修改CONFIG内容# 4. 格式化字符串
print("%s 的坐标是 (%.2f, %.2f)" % ("东京", 35.68, 139.69))

元组vs列表性能对比

import sys
import timeitlist_size = sys.getsizeof([1, 2, 3, 4, 5])  # 112 bytes
tuple_size = sys.getsizeof((1, 2, 3, 4, 5))  # 88 byteslist_time = timeit.timeit("x = [1, 2, 3, 4, 5]", number=1000000)  # 约0.06秒
tuple_time = timeit.timeit("x = (1, 2, 3, 4, 5)", number=1000000) # 约0.02秒

三、字典：高效的键值映射

字典通过哈希表实现，具有O(1)时间复杂度的查找效率。

基础操作详解

# 创建字典
student = {"name": "Alice","age": 20,"courses": ["Math", "Physics"]
}# 增/改元素
student["email"] = "alice@example.com"  # 新增
student["age"] = 21  # 修改# 删除元素
del student["courses"]  # 删除键值对
age = student.pop("age")  # 删除并返回值# 查询元素
print(student["name"])  # 直接访问（键不存在会报错）
print(student.get("phone", "N/A"))  # 安全访问，不存在返回默认值# 遍历字典
for key in student:  # 遍历键print(key)for key, value in student.items():  # 同时遍历键值print(f"{key}: {value}")

嵌套字典实战

# 多层嵌套结构
university = {"departments": {"CS": {"head": "Dr. Smith","courses": ["Algorithms", "AI"]},"Math": {"head": "Dr. Johnson","courses": ["Calculus", "Statistics"]}},"students": 15000
}# 访问嵌套值
print(university["departments"]["CS"]["courses"][0])  # "Algorithms"# 修改嵌套值
university["departments"]["Math"]["head"] = "Dr. Brown"# 添加新系
university["departments"]["Physics"] = {"head": "Dr. Wilson","courses": ["Mechanics", "Quantum Physics"]
}# 安全访问深层次键
from collections import defaultdict
grades = defaultdict(lambda: "N/A", {"Math": "A", "Physics": "B"})
print(grades["Chemistry"])  # 输出 "N/A" 而不报错

字典推导式

# 基本推导式
numbers = [1, 2, 3, 4]
squares = {x: x**2 for x in numbers}  # {1: 1, 2: 4, 3: 9, 4: 16}# 条件过滤
even_squares = {x: x**2 for x in numbers if x % 2 == 0}  # {2: 4, 4: 16}# 键值转换
student = {"name": "Alice", "age": 20}
uppercase = {key.upper(): str(value).upper() for key, value in student.items()}  # {"NAME": "ALICE", "AGE": "20"}

四、集合：无序且唯一

集合用于存储不重复元素，支持数学集合运算。

基本操作

# 创建集合
primes = {2, 3, 5, 7, 11}
evens = set([2, 4, 6, 8, 10])# 添加元素
primes.add(13)    # {2, 3, 5, 7, 11, 13}
primes.add(3)     # 重复元素自动忽略# 删除元素
primes.remove(2)  # 删除存在的元素
primes.discard(4) # 安全删除（元素不存在不报错）# 集合运算
A = {1, 2, 3, 4}
B = {3, 4, 5, 6}print(A | B)  # 并集 {1, 2, 3, 4, 5, 6}
print(A & B)  # 交集 {3, 4}
print(A - B)  # 差集 {1, 2}
print(A ^ B)  # 对称差 {1, 2, 5, 6}# 成员测试（O(1)时间复杂度）
if 5 in B:print("5在集合B中")

集合实际应用

# 1. 数据去重
words = ["hello", "world", "hello", "python", "world"]
unique_words = set(words)  # {"hello", "world", "python"}# 2. 关系测试
developers = {"Alice", "Bob", "Charlie"}
designers = {"Bob", "David", "Eve"}
both_roles = developers & designers  # {"Bob"}# 3. 过滤重复内容
emails = ["a@test.com", "b@test.com", "a@test.com", "c@test.com"]
unique_emails = list(set(emails))  # 去重后转回列表# 4. 大型数据成员测试（效率远高于列表）
big_set = set(range(1000000))
%timeit 999999 in big_set  # 约 0.03 毫秒big_list = list(range(1000000))
%timeit 999999 in big_list # 约 12 毫秒

数据结构对比与选型指南

特性	列表(List)	元组(Tuple)	字典(Dict)	集合(Set)
可变性	可变	不可变	可变	可变
排序	有序	有序	无序（Python3.7+有序）	无序
元素特性	可重复	可重复	键唯一	元素唯一
查找速度	O(n)	O(n)	O(1)	O(1)
内存占用	中等	较小	较大	较大
典型应用	同质数据序列	数据保护/常量	键值映射	去重/集合运算

选型决策树：

需要修改元素？ → 列表（有序数据）/字典（键值对）
需要保护数据不被修改？ → 元组
需要快速查找元素？ → 字典（按键查找）/集合（按值查找）
需要去重？ → 集合
需要数学集合运算？ → 集合

最佳实践建议：

使用元组存储不应更改的数据（如配置常量）
优先选择字典进行键值映射，特别是大型数据集
使用集合推导式比循环更高效
切片操作时注意：start包含，end不包含
字典键必须为不可变类型（字符串、数字、元组）

掌握这些核心数据结构及其特性，能够根据具体需求选择最合适的工具，大幅提升代码效率和可读性。

本文由元来智联开发团队出品：元来智联-网站、小程序等定制开发，专业开发服务商

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/91005.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/91005.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！