微博-微博指定博主采集博文信息(含图片下载)-[大数据可视化]
采集微博博主个人资料,以及发布的博文信息,支持批量设置博主id,支持限定博文发布的时间范围,下载博文图片等功能。
- 微博
- 博文
- 博主
- 批量
- 话题
- 评论
分享有奖
购买应用 ¥ 100 /月
业务场景
【适用人群】
- 社交媒体运营:需要监测竞品或行业KOL动态
- 市场调研人员:分析用户舆情或热点话题
- 数据分析师:采集微博数据用于用户行为研究
- 公关团队:实时监测品牌相关讨论等等
【解决痛点】
- 人工低效:手动采集博主信息及博文耗时耗力
- 数据不完整:人工采集容易遗漏关键博文或博主资料
- 时效性差:难以实时监测指定时间范围内的博文
- 数据整理繁琐:手动整理Excel效率低且易出错
【核心价值】
- 效率提升:自动化采集,节省90%以上时间
- 精准数据:按时间范围筛选,确保数据符合需求
- 批量处理:支持多博主ID同时采集,提高覆盖率
- 结构化存储:数据自动整理至Excel,便于后续分析
功能介绍(使用说明)
RPA应用功能
通过预先设置博主ID、时间范围等参数,RPA自动登录微博,进入博主主页,采集以下数据:
- 博主资料:账号UID、账号昵称、关注数、粉丝数、认证信息;
- 博文信息:博文内容、文章链接、发布时间、发布区域、文章图片数量、文章转发数、文章评论数、文章点赞数、图片编号;
- 按时间筛选:仅采集设定时间范围内的博文(如2025-04-01至2025-04-30);
- 支持下载博文的图片到本地。
启动参数说明
- 博主id:你想要采集的博主id(博主id为博主主页链接的最后一串数字,如图),支持批量,一行一个;
- 选择保存数据的excel:采集到的数据会自动保存到此excel中;
- 保存图片的文件夹:博文的图片将下载到这个指定的文件夹内;
- 设置开始时间:博主发布的博文开始时间(例如设置2025-04-01,即代表从博文发布时间为2025-04-01开始采集,2025-04-01之前发布的不采集);
- 设置结束时间:博主发布的博文结束时间(例如设置2025-04-30,即代表采集到博文发布时间为2025-04-30结束,2025-04-30之后发布的不采集);
如上图,设置开始时间2025-04-01,设置结束时间2025-04-30,代表采集博主在2025-04-01~2025-04-30之间发布的博文,不在这个时间范围内的不采集。
注意事项
- 程序默认使用Microsoft Edge浏览器打开微博,启动应用前,请确保Microsoft Edge浏览器中已安装OctopusRPA插件,安装插件请参考:https://rpa.bazhuayu.com/helpcenter/docs/PLoQif
- 用户需在Microsoft Edge浏览器上登录微博;
- 应用运行过程中,不要操作鼠标和键盘;
- 为避免触发微博反爬机制,建议控制采集频率,或使用多个账号轮换采集。
运行结果预览
版本
版本 2
2025-06-09
修复已知问题,兼容提取“展开”后的博文内容
版本 1
2025-05-22
首次发布