今日头条-根据关键词爬取文章-[无限超人]
根据关键词进行爬取今日头条的新闻文章信息。
- 社媒
- 无限超人
- 今日头条
- 新闻
业务场景
【适用人群】
1. 舆情分析师:10分钟抓完热点新闻,情感/地域分布一键进BI
2. 新媒体运营:按关键词日更行业快讯,选题快对手3小时
3. 无货源内容号主:批量改写头条高赞文,10个号同步灌水
【解决痛点】
1. 瀑布流+反爬,Python脚本周周失效,运维成本爆表
2. 手工翻页复制,200条后眼花手抖,漏掉爆火新帖
3. 字段格式乱:正文含广告、时间戳不一,洗数据3小时起
【核心价值】
1. RPA自动翻页+关键词检索,15分钟千条标准字段入库,效率=8个实习生
2. 零代码,运营小姐姐直接导入关键词Excel,立省技术外包1万起
3. 一键导出含账号链接、点赞/评论数的标准化表格,热点回溯、选题快人一步
功能介绍(使用说明)
RPA应用功能
根据关键词搜索采集今日头条的新闻资讯信息,包含标题、正文、账号名、账号主页链接、点赞数、评论、帖子url、发布时间等信息;支持翻页采集。
应用运行截图
1、输入关键词
2、【资讯】循环遍历采集每一个帖子信息
3、采集新闻信息
采集的字段:标题、正文、账号名、账号主页链接、点赞数、评论数、帖子详情url、发布时间、搜索关键词
启动参数说明
1、关键词参数:今日头条首页搜索框输入的关键词,多个关键词换行/回车输入,如:国产医疗、AI科技、法律法规;
2、excel文件存储路径:数据采集结果excel数据存储的文件夹选择;
3、翻页次数:每个关键词采集的最大翻页次数;
注意事项
1、RPA应用执行过程中请不要操作/移动鼠标;
2、此RPA应用执行使用的是“八爪鱼浏览器”;
运行结果预览
RPA应用执行后会在指定文件夹中生成excel文件,文件名称为:今日头条关键词搜索采集-{时间戳}.xlsx
应用报错反馈
版本
版本 6
2025-10-23
优化采集逻辑,支持翻页
版本 5
2025-09-15
xpath修复
版本 4
2025-07-18
修改说明文档
版本 3
2024-10-10
版本 2
2024-10-08
版本 1
2024-09-30
