什么是相似元素?
相似元素是一组元素列表,一般为网页上的一组具有类似结构的元素列表,例如一个表格、商品列表、新闻列表等,表现为有相似的结构,且被一个相同的元素所包含。绝大部分场景下我们会需要对相似元素里的元素逐个进行处理,且处理逻辑都一样。列表里的元素是复杂元素块时,可以结合"关联元素指令"一起使用。
循环相似元素指令配置说明
什么是关联元素?
关联元素会有一个参照元素,他跟这个参照元素有一的关系(例如,他是参照元素的父元素、相邻元素,子孙元素),实现的是以参照元素为基准,按照一定规则去定位其他元素。
关联元素指令配置说明
如何创建相似元素?
可通过在“循环相似元素列表”指令捕获相似元素
打开对应的网页,按住Shift,依次点击元素列表的第一和第二个元素
下面以国家法律法规数据库为例,创建的是标题列的相似元素(这个网页无法一整行作为相似元素),我可以修改相似元素的Xpath,改为循环每一行。
如何使用关联元素?
我们可以接着上面的相似元素,配合关联元素实现对列表数据的采集。循环相似元素会输出一个当前行的变量,代表正在处理哪一行。我们需要采集每一行里的所有列。列就是行的子元素,这个时候就要用到获取关联元素。
我们可以这样设置获取关联
这里使用的是通过xpath来定位第一列,这个Xpath是第一列相对于整行的Xpath路径,可以借助浏览器的DevTools(右键浏览器页面->点击‘检查’)确定这个Xpath,具体方法如下
运行效果
我们把数据写到一个数据表格里,看一下效果
教程对应的流程已通过链接给大家共享,大家可以点击“示例-列表数据提取_关联元素”获取,同时大家也可以扫码加入交流群,和大家一起交流
爪鱼RPA-用户交流群