外交部-例行记者会文字稿抓取-历史全量-[小查AI ]

外交部-例行记者会文字稿抓取-历史全量-[小查AI ]

通过八爪鱼RPA自动批量抓取外交部例行记者会全部文字稿新闻

  • 数据抓取
  • 网站
  • 新闻
分享有奖

业务场景

【适用人群】

适用于需要定期抓取网站新闻或信息的人群,抓取后的新闻可以上传到AI知识库作为资料

【解决痛点】

网站新闻每天抓取、上传到AI知识库操作重复枯燥,效率不高

【核心价值】

重新结合RPA的能力和AI知识库的应用,帮助用户快速搭建自己的AI专业知识库

功能介绍(使用说明)

RPA应用功能

通过预先设置好的参数,RPA应用将自动打开外交部例行记者会网站的每日新闻链接,全量抓取文本内容并保存到本地。


应用运行截图

打开外交部网站。

打开单条记者会网页,自动抓取全部文本内容。

保存到本地电脑,并用新闻标题命名。

运行逻辑图

打开外交部网站>建立循环相似元素,循环将单日记者会标题和链接保存到数据表格中>循环数据表格>依次打开单日记者会网页链接>抓取正文内容>保存到本地并用新闻标题命名


启动参数说明

1.参数1:文件夹路径。 填写需要保存到的本地文件夹路径。

2.参数2:外交部例行记者会索引页,默认网址为  https://www.fmprc.gov.cn/web/fyrbt_673021/jzhsl_673025/index.shtml

注意事项

  1. 打开的外交部例行记者会索引页的网址需要手工添加,如果需要抓取下一页,修改网址 "index_x",例如 https://www.fmprc.gov.cn/web/fyrbt_673021/jzhsl_673025/index_1.shtml    


运行结果预览


版本

版本 1

2025-06-12

首次发布