一、前言
本章节介绍的是一个很重要且常用的循环:循环相似元素web,在网页端应用的非常广泛
二、应用场景
应用于web网页,循环相似类型的网页信息并且把当前的循环项元素作为流程变量输出供后续流程使用。适用于对一个网页元素
列表要挨个进行处理的场景。比如某个新闻网站,我们想要循环点击列表每个新闻标题进入详情页进行数据采集或者批量采集列
表的新闻数据。
使用上也很简单,将该指令拖出,捕获或选择相似元素,并在循环体内,添加你要进行的操作,如数据抓取操作,如点击链接、
读取页面内容等。
三、实战演示
下面我们搭建一个流程,循环点击新闻标题进入详情页提取数据。此处演示的网址中国新闻网:
https://www.chinanews.com.cn/importnews.html
首先使用打开网址指令打开https://www.chinanews.com.cn/importnews.html,然后将【循环列表(web)】指令拖出,点击【捕获
元素按钮】,在该网页上按住Shift,依次点击元素列表的第一和第二个新闻标题,完成相似元素的捕获
之后就是在循环体内添加我们要执行的操作,即点击元素,获取网页元素,此处提取详情页的网址。
下图就是完整的流程,执行的逻辑为:打开网页后,把相似元素组里的元素一个一个拿出来处理,每次拿出来那个元素,我们给
它起了个名字,叫做当前网页元素,循环体内针对这个网页元素进行点击(即点击页面上的标题进入详情页),并获取到新打开
的网页对象,获取到该网页的网址,直到取完循环里所有元素,循环结束。
运行的过程如下所示:
好了,循环相似元素web这个指令,应用是极为广泛的,凡是涉及到在网页上把一批元素、一组元素依次地拿出来进行处理的这
种场景,第一时间就想到循环相似元素web指令处理即可。