外交部-例行记者会文字稿抓取-历史全量-[小查AI ]

通过八爪鱼RPA自动批量抓取外交部例行记者会全部文字稿新闻

业务场景

适用于需要定期抓取网站新闻或信息的人群，抓取后的新闻可以上传到AI知识库作为资料

网站新闻每天抓取、上传到AI知识库操作重复枯燥，效率不高

重新结合RPA的能力和AI知识库的应用，帮助用户快速搭建自己的AI专业知识库

通过预先设置好的参数，RPA应用将自动打开外交部例行记者会网站的每日新闻链接，全量抓取文本内容并保存到本地。

打开外交部网站。

打开单条记者会网页，自动抓取全部文本内容。

保存到本地电脑，并用新闻标题命名。

打开外交部网站>建立循环相似元素，循环将单日记者会标题和链接保存到数据表格中>循环数据表格>依次打开单日记者会网页链接>抓取正文内容>保存到本地并用新闻标题命名

1.参数1：文件夹路径。填写需要保存到的本地文件夹路径。

打开的外交部例行记者会索引页的网址需要手工添加，如果需要抓取下一页，修改网址 "index_x"，例如 https://www.fmprc.gov.cn/web/fyrbt_673021/jzhsl_673025/index_1.shtml

版本 1

2025-06-12

首次发布

开发者

高级开发者

赵朋

59807081@qq.com

相关推荐