微博-微博指定博主采集博文信息(含图片下载)-[大数据可视化]

微博-微博指定博主采集博文信息(含图片下载)-[大数据可视化]

采集微博博主个人资料,以及发布的博文信息,支持批量设置博主id,支持限定博文发布的时间范围,下载博文图片等功能。

  • 微博
  • 博文
  • 博主
  • 批量
  • 话题
  • 评论
分享有奖
购买应用  ¥ 100 /月

业务场景

【适用人群】

  1. 社交媒体运营:需要监测竞品或行业KOL动态
  2. 市场调研人员:分析用户舆情或热点话题
  3. 数据分析师:采集微博数据用于用户行为研究
  4. 公关团队:实时监测品牌相关讨论等等

【解决痛点】

  1. 人工低效:手动采集博主信息及博文耗时耗力
  2. 数据不完整:人工采集容易遗漏关键博文或博主资料
  3. 时效性差:难以实时监测指定时间范围内的博文
  4. 数据整理繁琐:手动整理Excel效率低且易出错

【核心价值】

  1. 效率提升:自动化采集,节省90%以上时间
  2. 精准数据:按时间范围筛选,确保数据符合需求
  3. 批量处理:支持多博主ID同时采集,提高覆盖率
  4. 结构化存储:数据自动整理至Excel,便于后续分析

功能介绍(使用说明)

RPA应用功能

通过预先设置博主ID、时间范围等参数,RPA自动登录微博,进入博主主页,采集以下数据:

  1. 博主资料:账号UID、账号昵称、关注数、粉丝数、认证信息;
  2. 博文信息:博文内容、文章链接、发布时间、发布区域、文章图片数量、文章转发数、文章评论数、文章点赞数、图片编号;
  3. 按时间筛选:仅采集设定时间范围内的博文(如2025-04-01至2025-04-30);
  4. 支持下载博文的图片到本地。

启动参数说明

  • 博主id:你想要采集的博主id(博主id为博主主页链接的最后一串数字,如图),支持批量,一行一个;

  • 选择保存数据的excel:采集到的数据会自动保存到此excel中;
  • 保存图片的文件夹:博文的图片将下载到这个指定的文件夹内;
  • 设置开始时间:博主发布的博文开始时间(例如设置2025-04-01,即代表从博文发布时间为2025-04-01开始采集,2025-04-01之前发布的不采集);
  • 设置结束时间:博主发布的博文结束时间(例如设置2025-04-30,即代表采集到博文发布时间为2025-04-30结束,2025-04-30之后发布的不采集);

如上图,设置开始时间2025-04-01,设置结束时间2025-04-30,代表采集博主在2025-04-01~2025-04-30之间发布的博文,不在这个时间范围内的不采集。

注意事项

  1. 程序默认使用Microsoft Edge浏览器打开微博,启动应用前,请确保Microsoft Edge浏览器中已安装OctopusRPA插件,安装插件请参考:https://rpa.bazhuayu.com/helpcenter/docs/PLoQif
  2. 用户需在Microsoft Edge浏览器上登录微博;
  3. 应用运行过程中,不要操作鼠标和键盘;
  4. 为避免触发微博反爬机制,建议控制采集频率,或使用多个账号轮换采集。

运行结果预览

版本

版本 2

2025-06-09

修复已知问题,兼容提取“展开”后的博文内容

版本 1

2025-05-22

首次发布