外交部-例行记者会文字稿抓取-历史全量-[小查AI ]
通过八爪鱼RPA自动批量抓取外交部例行记者会全部文字稿新闻
- 数据抓取
- 网站
- 新闻
分享有奖
业务场景
【适用人群】
适用于需要定期抓取网站新闻或信息的人群,抓取后的新闻可以上传到AI知识库作为资料
【解决痛点】
网站新闻每天抓取、上传到AI知识库操作重复枯燥,效率不高
【核心价值】
重新结合RPA的能力和AI知识库的应用,帮助用户快速搭建自己的AI专业知识库
功能介绍(使用说明)
RPA应用功能
通过预先设置好的参数,RPA应用将自动打开外交部例行记者会网站的每日新闻链接,全量抓取文本内容并保存到本地。
应用运行截图
打开外交部网站。
打开单条记者会网页,自动抓取全部文本内容。
保存到本地电脑,并用新闻标题命名。
运行逻辑图
打开外交部网站>建立循环相似元素,循环将单日记者会标题和链接保存到数据表格中>循环数据表格>依次打开单日记者会网页链接>抓取正文内容>保存到本地并用新闻标题命名
启动参数说明
1.参数1:文件夹路径。 填写需要保存到的本地文件夹路径。
2.参数2:外交部例行记者会索引页,默认网址为 https://www.fmprc.gov.cn/web/fyrbt_673021/jzhsl_673025/index.shtml
注意事项
- 打开的外交部例行记者会索引页的网址需要手工添加,如果需要抓取下一页,修改网址 "index_x",例如 https://www.fmprc.gov.cn/web/fyrbt_673021/jzhsl_673025/index_1.shtml
运行结果预览
版本
版本 1
2025-06-12
首次发布