一、引言
(一)研究背景
在有限元分析、计算流体力学(CFD)、计算机辅助设计(CAD)等领域,网格文件是描述几何模型离散化信息的基础数据载体,包含节点坐标、单元连接关系、物理属性等关键信息。目前,网格文件格式多达数十种(如 VTK、STL、OBJ、ANSYS CDB 等),且分散存储于 Zenodo、GitHub、Research Data Australia 等开源平台。
手动获取与处理这些文件存在显著痛点:一是跨平台检索效率低,科研人员需逐一访问平台下载,易遗漏关键数据;二是格式兼容性差,不同仿真软件(如 ANSYS、ABAQUS)生成的文件需专业工具转换,预处理成本高。
Python 爬虫技术可实现数据的自动化获取,而 meshio 库支持 30 余种网格格式的读写与转换,二者结合可构建 "获取 - 处理" 一体化工具,显著提升网格数据的利用效率。
(二)研究现状
- 网络爬虫在数据获取中的应用:爬虫技术已广泛用于学术文献(如基于 Scrapy 的 PubMed 爬虫)、气象数据(如 NOAA 数据集爬取)等