知网论文批量下载pdf格式论文,油猴脚本

任务描述

今天收到一个任务,在知网上,把一位专家所有的论文全都下载下来,要保存为PDF格式。

知网不支持批量导出PDF格式论文。一个一个下载PDF,太繁琐了。

解决方案:找到一个油猴脚本,这个脚本可以从知网批量导出论文。

脚本安装

首先,使用 chrome 浏览器安装油猴,https://www.tampermonkey.net/。

点击导航栏的 用户脚本,在下面的搜索框输入 “知网”。
在这里插入图片描述

在这里插入图片描述

下图是这个脚本的介绍,最后更新日期是24年12月。该脚本支持了PDF的批量下载。
脚本地址

在这里插入图片描述

若你下载了不需要的脚本,在这里删除:
在这里插入图片描述

浏览器的设置

批量下载论文的PDF格式的时候,会频繁弹出窗口,所以要运行浏览器弹出窗口。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

浏览器更改默认下载路径,记得后面再改回来:

这样就可以把论文直接下载到一个文件夹里面。
在这里插入图片描述

批量导出PDF过程

在搜索作者的时候,可能有作者会同名,要为作者选择正确单位。

脚本安装后,在知网的右侧,会出现一个批量下载的按钮
在这里插入图片描述

点击右侧批量下载的按钮之后,会弹出下述界面。

  • 获取链接:捕获知网当前界面的全部论文
  • 全选:选中全部论文
  • 下载:下载选中的论文
  • 清除数据:在下一次获取链接的时候,需要先清除数据
    在这里插入图片描述

在使用的过程中,下载达到40篇以上的论文的时候,知网就会频繁的弹出验证码。然后要求重新登录。这个验证的过程会难受一些。

【优化方案】:拼多多,淘宝 花个几块钱,可以买个他们自己搭建的知网镜像网站账号,他们的网站不会有这么多的验证码

论文下载篇数验证

论文如果重复下载了,文件会重命名,重复的文件会以括号加数字结尾,直接删除就行。

下述的Python脚本,辅助用户找出漏掉的论文。
知网可以批量导出论文的BibTex格式的参考文献的引用格式。

在这里插入图片描述

bib格式的导出文件的论文名字为:title = {xxx}。可以使用正则表达式匹配到论文的标题。与下载文件夹的论文对比,就可以找出哪些论文还没下载了。

实现代码如下:

import re
import osfile_bib = "BibTex批量导出的参考格式.bib"
source_dir = "论文下载的文件夹"with open(file_bib, "r") as f:text = f.read()data = re.findall("title = {(.*?)}", text)# 已下载的论文
down_papers = [name.split("_")[0] for name in os.listdir(source_dir)]for idx, paper_name in enumerate(data):if paper_name not in down_papers:page = idx // 20 + 1print(paper_name, page)

输出结果是论文名和对应的页码数。知网一页20篇论文,用bib的下标数量除以20,就知道该论文所在的页码数了。这样方便后续手动下载。
在这里插入图片描述

参考资料

  • https://blog.csdn.net/qq_43210428/article/details/144588820

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/91755.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/91755.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

低代码平台:驱动项目管理敏捷开发新范式

随着企业数字化转型加速,项目管理系统已从单一任务跟踪工具到集成流程自动化、资源调度、跨团队协作与风险监控的综合平台,项目管理系统的功能复杂度持续提升。然而,根据Gartner 2024年研究报告显示,约60%的项目管理系统因未能有效…

图机器学习(11)——链接预测

图机器学习(11)——链接预测0. 链接预测1. 基于相似性的方法1.1 基于指标的方法1.2 基于社区的方法2. 基于嵌入的方法0. 链接预测 链接预测 (link prediction),也称为图补全,是处理图时常见的问题。具体而言,给定一个…

简单2步配置CadenceSkill开发编辑器,支持关键字高亮

Cadence 使用过程中难免会与skill打交道,有时候网上找到的开源skill,想要查看或者编辑一下,常规的txt编辑器没有关键字高亮,看起来极为不方便。 利用Sublime Text可以很快速配置出支持skill关键字高亮的编辑器。 一、安装 Sublime…

Leetcode刷题营第三十三题:对称二叉树

101. 对称二叉树 给你一个二叉树的根节点 root , 检查它是否轴对称。 示例 1: 输入:root [1,2,2,3,4,4,3] 输出:true示例 2: 输入:root [1,2,2,null,3,null,3] 输出:false 提示:…

day055-Dockerfile与常用指令

文章目录0. 老男孩思想-女性的第一需求1. Dockerfile1.1 Dockerfile的基本结构1.2 案例-制作小鸟飞飞镜像1.2.1 编写Dockerfile文件1.2.2 构建镜像1.2.3 启动容器1.3 Dockerfile常用指令1.4 面试题:Dockerfile中CMD和ENTRYPOINT的区别?1.5 案例-制作zrlo…

Spring Boot 应用优雅停机与资源清理:深入理解关闭钩子

在开发和部署 Spring Boot 应用程序时,除了关注其启动和运行,理解如何实现**优雅停机(Graceful Shutdown)**也同样至关重要。优雅停机意味着在应用程序关闭时,能够有序地释放资源、完成正在进行的任务,并避…

淘宝扭蛋机小程序开发:重构电商娱乐化体验的新范式

在电商行业同质化竞争加剧的当下,消费者对购物体验的期待已从“功能满足”转向“情感共鸣”。淘宝扭蛋机小程序凭借“盲盒式随机奖励游戏化交互”的创新模式,成为撬动年轻用户消费力的新支点。其开发逻辑不仅是对传统电商的升级,更是对“娱乐…

YOLO演变史(一)

在YOLOV1发布后,作者并没有满足于此,而是持续对YOLO进行了改进。 YOLOV2:Better, Faster, Stronger YOLOv2(又称YOLO9000)发表于2017年CVPR,是YOLO系列的第二代版本。其论文标题“Better, Faster, Stronger…

专题:2025智能体研究报告|附70份报告PDF、原数据表汇总下载

原文链接:https://tecdat.cn/?p43035 智能体正在改写商业规则:某城商行的智能客服用公有云部署,把单笔交互成本从5.7元砍到1.2元,投诉率直降42%(《赛迪智库:2025全球智能体进展报告》P24)&…

Axios 完整功能介绍和完整示例演示

Axios 是一个基于 Promise 的现代化 HTTP 客户端库,用于浏览器和 Node.js 环境。它提供了简洁的 API 和强大的功能,是前端开发中最常用的网络请求工具之一。核心功能 浏览器 & Node.js 双平台支持 浏览器中使用 XMLHttpRequestNode.js 中使用 http 模…

math.h函数

math.c函数作用 1. 基本三角函数(参数为弧度) sin(double x):计算正弦值。cos(double x):计算余弦值。tan(double x):计算正切值。asin(double x):反正弦(返回值范围:[-π/2, π/2]&…

在Next.js里玩转pdf预览

1.背景在项目开发中,pdf预览是一个很常见的业务。各大公司为了保护自己的知识产权,也会对pdf预览进行限制,比如:不允许下载、打印,不允许提取文字等等。要想在实现预览功能的基础上还要附加这些限制,有很多…

算法竞赛备赛——【图论】求最短路径——Floyd算法

floyd算法 基于动态规划 应用:求多源最短路 时间复杂度:n^3 dijkstra:不能解决负边权 floyd:能解决负边权 不能解决负边权回路问题 求最短路径:dijkstra bfs floyd 思路 1.让任意两点之间的距离变短:引入…

双指针(滑动窗口)相关算法题

双指针算法有时候也叫尺取法或者滑动窗口,是⼀种优化暴力枚举策略的手段:当我们发现在两层 for 循环的暴力枚举过程中,两个指针是可以不回退的,此时我们就可以利用两个指针不回退的性质来优化时间复杂度。因为双指针算法中&#x…

ScratchCard刮刮卡交互元素的实现

效果展示 刮刮卡是⼀种常见的网页交互元素,通过模拟物理世界的刮涂层来揭示下方的内容。这种效果主要依赖于HTML5的 元素来实现。以下是⼀个基于TypeScript的刮刮卡实现示例,包括配置项、初始化方法和核心的刮开逻辑。下面是展示的效果部分刮开效果&…

【Python LeetCode 专题】热题 100,重在思路

哈希1. 两数之和49. 字母异位词分组128. 最长连续序列双指针283. 移动零11. 盛最多水的容器15. 三数之和42. 接雨水滑动窗口3. 无重复字符的最长子串438. 找到字符串中所有字母异位词子串560. 和为 K 的子数组239. 滑动窗口最大值普通数组53. 最大子数组和56. 合并区间189. 轮转…

openEuler 22.03 LTS Rootless Docker 安装指南

openEuler 22.03 LTS Rootless Docker 安装指南 1.创建普通用户(用于无根模式) sudo useradd -m docker-user sudo passwd docker-user # 设置密码 sudo usermod --add-subuids 100000-165535 docker-user sudo usermod --add-subgids 100000-165535 do…

CMake指令:常见内置命令行工具( CMake -E )

目录 1.简介 2.核心作用 3.常用命令介绍 3.1.文件操作命令 3.2.系统命令执行 3.3.校验与哈希 3.4.流程控制与等待 3.5.路径与文件处理 3.6.归档与压缩 3.7.网络与下载 3.8.实用工具 4.使用示例 5.与 shell 命令的对比 6.在 CMake 脚本中使用 7.总结 相关链接 1…

YOLO融合CAF-YOLO中的ACFM模块

YOLOv11v10v8使用教程: YOLOv11入门到入土使用教程 YOLOv11改进汇总贴:YOLOv11及自研模型更新汇总 《CAF-YOLO: A Robust Framework for Multi-Scale Lesion Detection in Biomedical Imagery》 一、 模块介绍 论文链接:https://arxiv.org…

Webpack 项目构建优化详解

1. 相关面试题 1.1. 做过哪些Webpack打包构建优化? 代码分割:使用 Webpack 的 SplitChunksPlugin 进行代码分割,将第三方库、公共代码与业务代码分离,提高缓存利用率和加载速度。 Tree Shaking:通过配置 mode: production 或使用 TerserPlugin,移除未引用的代码,减少…