当然有!在科学计算、机器学习、图像处理等领域,scikit-learn
、scikit-image
(skimage)、SciPy
、OpenCV
是非常重要的库,但它们不是唯一的。以下是一些与它们类似或互补 的项目,按照用途分类列出:
🧠 机器学习类(类似 scikit-learn)
库名 简介 适用场景 XGBoost 高性能梯度提升树(GBDT)库 结构化数据建模、Kaggle比赛常用 LightGBM 微软出品的快速GBDT实现 大规模训练、速度优先 CatBoost Yandex出品,支持类别特征的GBDT 类别数据很多的场景 TensorFlow Google推出的深度学习框架 复杂神经网络建模 PyTorch Facebook开发,动态图计算框架 学术研究、CV/NLP Statsmodels 专注于统计建模 回归分析、时间序列 H2O.ai 分布式机器学习平台 企业级自动建模
🧮 科学计算类(类似 scipy)
库名 简介 功能 NumPy 数值计算核心库 向量、矩阵、广播、FFT 等 SciPy 构建于 NumPy 之上 优化、积分、微分方程、信号处理等 SymPy 符号计算(代数计算) 解方程、化简、符号微分等 Numba JIT 编译器加速 NumPy 代码 性能提升,写原生 Python 即可 CuPy NumPy 的 GPU 版本 GPU 上加速矩阵计算 Theano(已停更) 数学表达式的编译器 TensorFlow 的前身
🖼️ 图像处理类(类似 scikit-image 和 OpenCV)
库名 简介 优势 scikit-image 基于 NumPy 的图像处理库 与 Python 科学堆栈无缝集成 OpenCV (cv2) 全功能计算机视觉库 图像、视频、摄像头、实时CV Pillow (PIL) 图像读写和简单操作 轻量且适合初学者 imageio 读写图像/视频/GIF等 与 Pillow 类似,更通用 PyTorch torchvision 深度学习图像预处理和模型 与 PyTorch 一起用 Albumentations 图像增强库 数据增强功能强大,CV比赛常用 SimpleITK 医学图像处理 支持 DICOM、NIfTI 等格式
📊 数据处理与分析(类似 Pandas)
库名 简介 场景 Pandas 表格数据处理核心库 数据清洗、分析 Dask 并行化的 Pandas/Numpy 处理超大数据集 Polars Rust 编写的 DataFrame 库 更快的列式处理 Vaex 内存外 DataFrame 用于十亿行数据分析 PyArrow Apache Arrow 的 Python 实现 高效序列化、支持共享内存
⏳ 时间序列分析
库名 简介 statsmodels.tsa
ARIMA, SARIMA 等 Prophet Facebook 出品的时间序列预测库 tsfresh 时间序列特征自动提取 sktime scikit-learn 风格的时间序列库
🧪 自动机器学习(AutoML)
库名 简介 Auto-sklearn 自动调参、特征工程、模型选择 TPOT 基因算法搜索模型流程 H2O AutoML 企业级 AutoML FLAML 微软的轻量化 AutoML
🔌 其他值得关注的生态工具
工具 用途 joblib
模型存储、并行计算 matplotlib
, seaborn
, plotly
可视化 mlflow
机器学习实验管理 optuna
, ray[tune]
超参数优化 huggingface/transformers
NLP 模型库(BERT、GPT等)