前言
本文是该专栏的第81篇,后面会持续分享python爬虫干货知识,记得关注。
本文,笔者将详细介绍一个基于政务网站进行自动采集数据的爬虫框架。对此感兴趣的同学,千万别错过。
废话不多说,具体细节部分以及详细思路逻辑,跟着笔者直接往下看正文部分。(附带框架完整代码)
正文
框架功能:基于政务网站,进行自动采集数据
接下来,笔者直接开门见山。将整个爬虫框架逐一介绍。
1. 相关依赖库安装
在开始之前,首先需要提前安装好本文要用到的相关依赖库。如下所示:
requests
lxml
loguru
traceback
python-docx
如果你本地环境,已经安装上述依赖库,可以直接跳过该步骤。反之,本地环境未安装,直接在终端使