MATLAB | 如何使用MATLAB获取《Nature》全部绘图 (附23-25年图像)

文末有全部图片资源

我在两年前更过如何用 MATLAB 爬取 《Nature》全部插图,最近又有人问我有没有下载好的24,25年插图的压缩包,于是又去拿代码运行了一下,发现两年前写的代码今天居然还能用,代码如下:

function getNaturePNGWhileTure(YEAR)
if nargin < 1YEAR = 2024;
endpbegin = 1; ibegin = 1; jbegin = 1; 
forderName=['Year_',num2str(YEAR)];
if exist(['.\image_',forderName,'\pijbreak.mat'],'file')load(['.\image_',forderName,'\pijbreak.mat']);
end
if ~exist(['.\image_',forderName],'dir')mkdir(['.\image_',forderName]);
end
disp([pbegin,ibegin,jbegin])url_full = 'https://www.nature.com/nature/research-articles?searchType=journalSearch&sort=PubDate&year=<Y/>&page=<P/>';
url_year = strrep(url_full,'<Y/>',num2str(YEAR));options=weboptions('Timeout',inf);
html_year  = webread(strrep(url_year,'<P/>','1'),options);fprintf('1->')
A_page_num = strfind(html_year,'u-visually-hidden'); 
Z_page_num = strfind(html_year,'data-page="next"');
page_num   = html_year(A_page_num(find(A_page_num<Z_page_num,1,'last')):Z_page_num);
page_num   = page_num(32:36);
page_num   = str2double(page_num(abs(page_num)<=57&abs(page_num)>=48));for p = pbegin:page_numurl_page  = strrep(url_year,'<P/>',num2str(p));html_page = webread(url_page,options);fprintf('2\n')A_html_artical = strfind(html_page,'itemprop="name headline"');Z_html_artical = strfind(html_page,'data-track-action="view article"');for i = ibegin:length(Z_html_artical)html_artical = html_page(A_html_artical(find(A_html_artical<Z_html_artical(i),1,'last')):Z_html_artical(i));A_artical    = strfind(html_artical,'<a href=');Z_artical    = strfind(html_artical,'class="c-card__link u-link-inherit"');html_artical = html_artical(A_artical(1)+10:Z_artical);html_artical = html_artical(1:find(html_artical=='"')-1);for j = jbegin:50pbegin = p; ibegin = i ; jbegin = j;save(['.\image_',forderName,'\pijbreak.mat'],'pbegin','ibegin','jbegin')html_png=webread(['https://www.nature.com/',html_artical,'/figures/',num2str(j)]);A_png = strfind(html_png,'aria-describedby');Z_png = strfind(html_png,'alt="Fig.');if isempty(Z_png)break;elseurl_png  = html_png(A_png:Z_png(find(Z_png>A_png,1)));url_png  = ['https:',url_png(strfind(url_png,'src="')+5:end-3)];url_png  = strrep(url_png,'lw685','full');name_png = ['.\image_',forderName,'\',html_artical(10:end),' Fig-',num2str(j)];websave(name_png,url_png,options);disp(['Downloading Year-',num2str(YEAR),...' Page-',num2str(p),' Artical-',num2str(i),...' Fig-',num2str(j),':',html_artical])endendjbegin = 1;endibegin = 1;
end
end

使用方法很简单,例如下载2024年图片,就命令行窗口运行getNaturePNGWhileTure(2024)

代码做了断点设置,可以下载到一半暂停有空继续下,保存的文件名称即为论文编号,例如我想看看下面这张有意思图片的原文:

可以看到文章编号为s41586-023-06728-8,我们只需要搜索:

  • https://www.nature.com/articles/s41586-023-06728-8

下面展示一下比较有趣或者好看新颖的图片,然后会在文章最后给出这仨年全部图片的资源,大概一万多张图片。

部分图像展示

2023


2024

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


2025

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


资源链接

2023 (共计5068张)

  • https://pan.baidu.com/s/1iEMBewOyPbJNejhkxLhISg?pwd=slan

2024 (共计5550张)

  • https://pan.baidu.com/s/1Fk5J9TY_6ZaVqqF-flDcLQ?pwd=slan

2025 (共计2930张)

  • https://pan.baidu.com/s/1ji-uuc5dx-bpg43RykY_aQ?pwd=slan

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/909300.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国老年健康调查(CLHLS)数据挖掘教程(1)--CLHLS简介和数据下载

北京大学“中国老年健康影响因素跟踪调查&#xff08;简称‘中国老年健康调查’&#xff1b;英文名称为Chinese Longitudinal Healthy Longevity Survey (CLHLS)&#xff09;”及交叉学科研究由国家自然科学基金委主任基金应急项目、重大项目、重点项目及国际合作项目。1998-20…

基本多线程编译make命令

背景&#xff1a; 在ffmpeg源码编译的时候要等很久&#xff0c;快下班了&#xff0c;等不及。 解决方法&#xff1a; 使用多线程编译。 make -j{n} 如&#xff1a; make -j8详解&#xff1a;&#xff08;没时间看的可以返回了&#xff01;&#xff09; 在编译 FFmpeg 时使用…

MNIST数据集上朴素贝叶斯分类器(MATLAB例)

MNIST数据集上朴素贝叶斯分类器 Naive Bayes Classification fitcnb Train multiclass naive Bayes model Syntax Mdl fitcnb(Tbl,ResponseVarName) Mdl fitcnb(Tbl,formula) Mdl fitcnb(Tbl,Y) Mdl fitcnb(X,Y) Mdl fitcnb(___,Name,Value) [Mdl,AggregateOptimization…

网站设计小技巧:利用交互设计提升用户体验

现在很多企业朋友都会感觉到&#xff0c;做网站设计掌握不好设计网页的魂&#xff0c;换了很多设计方式可能效果都不理想。蒙特网站专注高端网站建设20多年&#xff0c;基于为华为、字节跳动、海康威视等头部企业打造网站的经验&#xff0c;今天将近期用户比较喜欢的网页设计方…

Github指南-Add .gitignore和Choose a license

Add .gitignore&#xff08;添加忽略文件列表&#xff09; &#x1f4cc; 作用&#xff1a; .gitignore 文件用于告诉 Git 哪些文件或文件夹**不要被上传&#xff08;版本控制&#xff09;**&#xff0c;例如&#xff1a; 编译生成的临时文件&#xff08;如 .exe, .o&#x…

如何打造沉浸式文件操作体验

在操作系统长期运行后&#xff0c;本地文件系统往往会面临一个常见却棘手的问题&#xff1a;元数据管理效率下降&#xff0c;导致用户在海量文件中检索目标内容时出现显著的延迟与操作成本。这种现象在未使用标签化或语义化管理系统的情况下尤为明显。 而 Oversis 的出现&…

企业AI深水区突围:从星辰大海到脚下泥泞的进化论

一、业务价值旅程&#xff1a;从降本增效到价值跃迁 1.1 技术落地的"甜蜜陷阱" 企业在AI应用初期往往陷入"高配用不起&#xff0c;低配用不了"的困境。一台8卡A100服务器每月电费超3万元的成本&#xff0c;对制造业利润形成巨大挤压。即便跨过算力门槛&a…

PostgreSQL的扩展moddatetime

PostgreSQL的扩展moddatetime moddatetime 是 PostgreSQL 的一个内置扩展&#xff0c;用于自动维护表的最后修改时间字段。这个扩展可以自动更新指定字段为当前时间戳&#xff0c;非常适合需要跟踪记录最后修改时间的应用场景。 一、moddatetime 基本功能 核心特性 自动更新…

自己的电脑搭建外网访问网站服务器的步骤

文章目录 PC电脑做网站服务器的步骤1.前言2. 网站服务器系统的安装2.1个人电脑安装IIS&#xff08;Windows7系统安装IIS7.0&#xff09;2.1.1&#xff1a;打开控制面板&#xff0c;给Windows安装插件 2.2网站配置&#xff1a;2.2.1打开网站配置项&#xff1a;2.2.2开始配置&…

基于深度学习的智能语音合成系统:技术与实践

前言 随着人工智能技术的飞速发展&#xff0c;智能语音合成&#xff08;Text-to-Speech, TTS&#xff09;技术已经成为人机交互领域的重要组成部分。从智能助手到有声读物&#xff0c;语音合成技术正在改变我们与数字内容的交互方式。近年来&#xff0c;深度学习技术为语音合成…

铸铁平台的制造工艺复杂而精细

铸铁平台的制造工艺确实复杂而精细。首先&#xff0c;需要选择合适的铸铁材料&#xff0c;通常是灰铸铁或球墨铸铁&#xff0c;以满足平台的强度和耐磨性要求。然后&#xff0c;根据设计要求&#xff0c;制作模具&#xff0c;并在高温下将铁液倒入模具中进行铸造。在铸造过程中…

ArcPy 与 ArcGIS .NET SDK 读取 GDB 要素类坐标系失败?GDAL 外挂方案详解

ArcPy 与 ArcGIS .NET SDK 读取 GDB 要素类坐标系失败&#xff1f;GDAL 外挂方案详解 在ArcGIS Pro中正常显示的坐标系&#xff0c;为何通过ArcPy或.NET SDK却无法正确读取&#xff1f;本文将分享我在处理CGCS2000坐标系时的踩坑经历&#xff0c;以及最终通过GDAL外挂方案解决问…

Zabbix 高可用架构部署方案(2最新版)

Zabbix 高可用架构部署方案&#xff08;MySQL 双 VIPHAProxyNginx&#xff09; 前景提要&#xff1a;使用 MySQL 作为数据库&#xff0c;两个虚拟 IP&#xff08;10.0.0.100 和 10.0.0.200&#xff09;&#xff0c;HAProxy 作为数据库负载均衡&#xff0c;Nginx 作为 Web 访问…

深入解析Linux分页机制:从虚拟内存到物理地址的魔法转换

目录 引言&#xff1a;为什么需要分页机制&#xff1f; 一、分页机制基础概念 1.1 虚拟地址与物理地址 1.2 页与页框 1.3 为什么是4KB&#xff1f; 二、多级页表结构 2.1 为什么需要多级页表&#xff1f; 2.2 x86_64的四级页表结构 2.3 页表项详解 三、Linux分页实现机…

使用python进行图像处理—图像变换(6)

图像变换是指改变图像的几何形状或空间位置的操作。常见的几何变换包括平移、旋转、缩放、剪切&#xff08;shear&#xff09;以及更复杂的仿射变换和透视变换。这些变换在图像配准、图像校正、创建特效等场景中非常有用。 6.1仿射变换(Affine Transformation) 仿射变换是一种…

NLP-数据集介绍(并不全,文本类介绍)

目录 第一章 STS&#xff08;语义文本相似度&#xff09; &#xff08;重点&#xff09;一、SemEval STS 年度任务&#xff08;2012-2017&#xff09;1. SemEval-2012 STS2. SemEval-2013 STS3. SemEval-2014 STS4. SemEval-2015 STS5. SemEval-2016 STS6. SemEval-2017 STS 二…

JS进阶 Day01

1.作用域和作用域链 let不可访问 var可访问&#xff0c;因为没有块作用域这一说法 2.JS垃圾回收机制以及算法 下图如上图同理 下图这个三个相互引用的&#xff0c;根部找不到&#xff0c;就进行清除。 3.JS闭包 4.变量和函数提升(了解) 5.函数剩余参数和展开运算符 还有种写法 …

详解Python当中的pip常用命令

想象一下&#xff0c;如果建造房屋时&#xff0c;每一块砖、每一根钢筋都需要你自己亲手烧制和打造&#xff0c;那会是怎样一番景象&#xff1f;软件开发也是如此。如果没有现成的、高质量的、可复用的代码库&#xff0c;开发者们就不得不重复“发明轮子”&#xff0c;效率低下…

LangChain面试内容整理-知识点10:文本嵌入模型(Embeddings)使用

文本嵌入(Embeddings)是将文字转换为向量(高维数值向量)的过程和结果。在LangChain中,Embeddings模块负责调用各种嵌入模型,将文本转化为向量表示,以便后续在向量空间执行相似度搜索、聚类等操作。这在实现语义搜索、RAG中非常关键,因为向量可以让计算机“理解”文本语…

To be or Not to be, That‘s a Token——论文阅读笔记——Beyond the 80/20 Rule和R2R

本周又在同一方向上刷到两篇文章&#xff0c;可以说&#xff0c;……同学们确实卷啊&#xff0c;要不卷卷开放场域的推理呢&#xff1f; 这两篇都在讲&#xff1a;如何巧妙的利用带有分支能力的token来提高推理性能或效率的。 第一篇叫 Beyond the 80/20 Rule: High-Entropy Mi…