今日头条-根据关键词爬取文章-[无限超人]

今日头条-根据关键词爬取文章-[无限超人]

根据关键词进行爬取今日头条的新闻文章信息。

  • 社媒
  • 无限超人
  • 今日头条
  • 新闻
分享有奖

业务场景

【适用人群】  

1. 舆情分析师:10分钟抓完热点新闻,情感/地域分布一键进BI  

2. 新媒体运营:按关键词日更行业快讯,选题快对手3小时  

3. 无货源内容号主:批量改写头条高赞文,10个号同步灌水  

【解决痛点】  

1. 瀑布流+反爬,Python脚本周周失效,运维成本爆表  

2. 手工翻页复制,200条后眼花手抖,漏掉爆火新帖  

3. 字段格式乱:正文含广告、时间戳不一,洗数据3小时起  

【核心价值】  

1. RPA自动翻页+关键词检索,15分钟千条标准字段入库,效率=8个实习生  

2. 零代码,运营小姐姐直接导入关键词Excel,立省技术外包1万起  

3. 一键导出含账号链接、点赞/评论数的标准化表格,热点回溯、选题快人一步


功能介绍(使用说明)

RPA应用功能

根据关键词搜索采集今日头条的新闻资讯信息,包含标题、正文、账号名、账号主页链接、点赞数、评论、帖子url、发布时间等信息;支持翻页采集。


应用运行截图

1、输入关键词


2、【资讯】循环遍历采集每一个帖子信息


3、采集新闻信息



采集的字段:标题、正文、账号名、账号主页链接、点赞数、评论数、帖子详情url、发布时间、搜索关键词


启动参数说明

1、关键词参数:今日头条首页搜索框输入的关键词,多个关键词换行/回车输入,如:国产医疗、AI科技、法律法规;

2、excel文件存储路径:数据采集结果excel数据存储的文件夹选择;

3、翻页次数:每个关键词采集的最大翻页次数;


注意事项

1、RPA应用执行过程中请不要操作/移动鼠标;

2、此RPA应用执行使用的是“八爪鱼浏览器”;


运行结果预览

RPA应用执行后会在指定文件夹中生成excel文件,文件名称为:今日头条关键词搜索采集-{时间戳}.xlsx



应用报错反馈

报错反馈入口

版本

版本 6

2025-10-23

优化采集逻辑,支持翻页

版本 5

2025-09-15

xpath修复

版本 4

2025-07-18

修改说明文档

版本 3

2024-10-10

版本 2

2024-10-08

版本 1

2024-09-30