使用影刀RPA实现快递信息抓取

最近公司项目有个需求,要求抓取快递单号快递信息,比如签收地点、签收日期等。该项目对应的快递查询网站是一个国外的网站,他们有专门的快递平台可以用于查询。该平台提供了快递接口进行查询,但需要付费。同时也提供了免费的查询窗口,一次最多可以查询25个快递单号。我们的快递单号比较多,有几千个,这时候RPA工具就派上用场啦。

我们的任务很简单,就是根据Excel清单里面提供的快递单号,在对应位置的单元格写入获取到的签收信息即可。涉及到的技术点如下:

读取Excel

这个点需要说明一下,影刀RPA提供了数据表格以及Excel表格。这两个功能的区别就在于使用Excel表格必须要安装Office,否则无法使用其功能。而数据表格更通用,更像是一个内存型的数据表格,不需要安装Office。

在这里插入图片描述

模拟批量提交查询快递单号信息

因为我是25个快递单号一组提交查询,抓取到信息保存,再提交25个新的快递单号查询,这样反复循环。网站格式上面要求每一个快递单号一行,最多25行。如图所示,最后一行的时候多一个换行,可以加个按键BackSpace,去除最后一行的换行,然后提交查询。
在这里插入图片描述

抓取带分页的快递信息

有两点需要注意:

  1. 首先要选择多页,此外要指定抓取的页数,因为我是25个一批,页面每页显示5个快递信息,那么就是5页。
  2. 我勾选了保存至数据表格,那么我也可以操作这个数据表格写入Excel。
    在这里插入图片描述

写入Excel

抓取数据到数据表格后,就可以操作数据表格,写入Excel。
在这里插入图片描述
当然上图中,我也是25个一组获取到快递信息后,就及时写入Excel。这样保证如果中途中断,之前抓取过的信息仍然会保留。

上面用到的pitch2是一个插入Python代码段。影刀RPA就是这个好处,可以直接使用Python的能力嵌入到影刀中,开发非常方便。

在这里插入图片描述

总结

  • 其实我之前是想通过爬虫程序去完成的,但是自从用了RPA工具就发现RPA做这类数据抓取的应用,效率更高。
  • RPA跟爬虫的区别就在于,RPA最大化的模拟了人的鼠标点击和键盘操作,让对方的网站感觉是一个人在操作,而不是什么程序,这样被封杀的概率会降低。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/95787.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/95787.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚁剑--安装、使用

用途限制声明,本文仅用于网络安全技术研究、教育与知识分享。文中涉及的渗透测试方法与工具,严禁用于未经授权的网络攻击、数据窃取或任何违法活动。任何因不当使用本文内容导致的法律后果,作者及发布平台不承担任何责任。渗透测试涉及复杂技…

Varjo XR虚拟现实军用车辆驾驶与操作培训

Patria基于混合现实的模拟器提供了根据现代车辆乘员需求定制的培训,与传统显示设置相比,全新的模拟解决方案具有更好的沉浸感和更小的物理空间需求。Patria是芬兰领先的国防、安全和航空解决方案提供商。提供尖端技术和全面的培训系统,以支持…

Java 10 新特性及具体应用

目录 1. 局部变量类型推断(JEP 286) 2. 不可修改集合(JEP 269) 3. 并行全垃圾回收(JEP 307) 4. 应用类数据共享(JEP 310) 5. 线程局部管控(JEP 312) 总结…

【力扣 Hot100】刷题日记

D8 全排列(非回溯法) 全排列原题链接 在刷leetcode的时候,看到这道题目并没法使用像STL的next_permutation方法,感叹C便利的同时,又惋惜Java并没有类似的API,那我们只能从原理入手了,仿写此算法。 其实回溯法更应该…

JetPack系列教程(七):Palette——让你的APP色彩“飞”起来!

JetPack系列教程(七):Palette——让你的APP色彩“飞”起来! 各位开发小伙伴们,还在为APP的配色发愁吗?别担心,今天咱们就来聊聊JetPack家族里的“色彩魔法师”——Palette!这个神奇的…

力扣hot100 | 矩阵 | 73. 矩阵置零、54. 螺旋矩阵、48. 旋转图像、240. 搜索二维矩阵 II

73. 矩阵置零 力扣题目链接 给定一个 m x n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例 1: 输入:matrix [[1,1,1],[1,0,1],[1,1,1]] 输出:[[1,0,1],[0,0,0],[1,0,1]]…

ARC与eARC是什么?主要用在哪?

在家庭影音设备不断升级的今天,人们对音视频体验的要求越来越高。无论是追剧、玩游戏还是观看电影大片,很多用户不再满足于电视自带的扬声器,而是希望借助回音壁、功放或家庭影院系统,获得更加震撼的沉浸式声音体验。一、ARC是什么…

解锁JavaScript性能优化:从理论到实战

文章目录 前言 一、常见性能瓶颈剖析 二、实战案例与优化方案 (一)DOM 操作优化案例​ (二)事件绑定优化案例​ (三)循环与递归优化案例​ (四)内存管理优化案例​ 三、性能优化工具介绍 总结 前言 性能优化的重要性 在当今数字化时代,Web 应用已成为人们生活和工作…

结构化记忆、知识图谱与动态遗忘机制在医疗AI中的应用探析(上)

往期相关内容推荐: 基于Python的多元医疗知识图谱构建与应用研究(上)

XSS攻击:从原理入门到实战精通详解

一、XSS攻击基础概念1.1 什么是XSS攻击 XSS(Cross-Site Scripting,跨站脚本攻击)是一种将恶意脚本注入到可信网站中的攻击手段。当用户访问被注入恶意代码的页面时,浏览器会执行这些代码,导致:用户会话被劫…

Leetcode 14 java

今天复习一下以前做过的题目,感觉是忘光了。 160. 相交链表 给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点,返回 null 。 图示两个链表在节点 c1 开始相交: 题目数…

用 FreeMarker 动态构造 SQL 实现数据透视分析

在 ERP、BI 等系统中,数据透视分析(Pivot Analysis)是非常常见的需求:用户希望按任意维度(如门店、时间、商品分类等)进行分组统计,同时选择不同的指标(如 GMV、订单数、客单价等&am…

13.深度学习——Minst手写数字识别

第一部分——起手式 import torch from torchvision import datasets, transforms import torch.nn as nn import torch.nn.functional as F import torch.optim as optimuse_cuda torch.cuda.is_available()if use_cuda:device torch.device("cuda") else: device…

【JAVA高级】实现word转pdf 实现,源码概述。深坑总结

之前的需求做好后,需求,客户突发奇想。要将生成的word转为pdf! 因为不想让下载文档的人改动文档。 【JAVA】实现word添加标签实现系统自动填入字段-CSDN博客 事实上这个需求难度较高,并不是直接转换就行的 word文档当中的很多东西都需要处理 public static byte[] gener…

数据驱动测试提升自动化效率

测试工程师老王盯着满屏重复代码叹气:“改个搜索条件要重写20个脚本,这班加到啥时候是个头?” 隔壁组的小李探过头:“试试数据驱动呗,一套脚本吃遍所有数据,我们组上周测了300个组合都没加班!”…

模板引用(Template Refs)全解析2

三、v-for 中的模板引用 当在 v-for 中使用模板引用时,引用的 value 会自动变为一个数组,包含列表中所有元素/组件的引用(需 Vue 3.5+ 版本,旧版需手动处理且顺序不保证)。 1. 基本用法(Vue 3.5+) <script setup> import { ref, useTemplateRef, onMounted } f…

【Linux系统】进程间通信:System V IPC——共享内存

前文中我们介绍了管道——匿名管道和命名管道来实现进程间通信&#xff0c;在介绍怎么进行通信时&#xff0c;我们有提到过不止管道的方式进行通信&#xff0c;还有System V IPC&#xff0c;今天这篇文章我们就来学习一下System V IPC中的共享内存1. 为何引入共享内存&#xff…

[优选算法专题二滑动窗口——最大连续1的个数 III]

题目链接 最大连续1的个数 III 题目描述 题目解析 问题本质 输入&#xff1a;二进制数组nums&#xff08;只包含 0 和 1&#xff09;和整数k操作&#xff1a;最多可以将k个 0 翻转成 1目标&#xff1a;找到翻转后能得到的最长连续 1 的子数组长度 这个问题的核心是要找到一…

C#单元测试(xUnit + Moq + coverlet.collector)

C#单元测试 xUnit Moq coverlet.collector 1.添加库 MlyMathLib 2.编写库函数内容 using System;namespace MlyMathLib {public interface IUserRepo{string GetName(int id);}public class UserService{private readonly IUserRepo _repo;public UserService(IUserRepo repo…

【数据库】Oracle学习笔记整理之五:ORACLE体系结构 - 参数文件与控制文件(Parameter Files Control Files)

Oracle体系结构 - 参数文件与控制文件&#xff08;Parameter Files & Control Files&#xff09; 参数文件与控制文件是Oracle数据库的“双核基石”&#xff1a;参数文件是实例的“启动配置中心”&#xff0c;定义运行环境与规则&#xff1b;控制文件是数据库的“物理元数据…