小红书-智能内容采集-[码农爹地RPA]
小红书平台采集&下载笔记(图片、视频),支持关键词搜索、博主主页等多种方式批量采集,下载笔记图片&视频文件到本地,回写采集结果到配置文件中。 全程模拟人工操作,安全可靠,提高效率。
- 小红书
- 笔记采集
- 关键词采集
- 博主主页采集
- 笔记列表采集
- 高赞评论采集
- 笔记图片&视频下载
业务场景
【适用人群】
- 内容创作者、自媒体运营者、品牌营销人员、市场调研人员、电商运营人员、数据分析师等需要高效采集小红书平台内容的用户群体。
【解决痛点】
- 手动采集小红书笔记内容(包括图片、视频、评论等)效率低下、容易出错,且难以批量处理。
- 无法快速筛选出符合特定条件(如点赞数、热度等)的优质笔记和高赞评论。
- 采集过程中需要频繁切换页面、手动下载文件,操作繁琐且耗时。
【核心价值】
- 高效采集:通过关键词搜索、博主主页、笔记链接等多种方式批量采集小红书笔记内容,大幅提升采集效率。
- 自动化下载:自动下载笔记中的图片和视频文件到本地,无需手动操作,节省时间和精力。
- 数据筛选:根据点赞数阈值、热度分类等参数,精准筛选出优质笔记和高赞评论,助力精准内容分析和创作。
- 安全可靠:全程模拟人工操作,避免对平台造成异常访问,保障账号安全。
- 数据记录:采集结果自动回写到配置文件中,方便随时查看和分析,便于后续内容创作、营销策划和市场调研。
功能介绍(使用说明)
RPA应用功能
小红书平台采集&下载笔记(图片、视频),支持关键词搜索、博主主页等多种方式批量采集,下载笔记图片&视频文件到本地,回写采集结果到配置文件中。
全程模拟人工操作,安全可靠,提高效率。
使用说明
1、填写配置文件(采集目标):
按需收集需要采集的关键词、博主主页、爆款笔记链接,然后打开配置文件(例如:小红书-智能内容采集.xlsx),按需对应的填入的【关键词列表】、【博主主页列表】、【笔记列表】或者【高赞评论采集表】中,保存后关闭。
2、填写配置文件(采集参数):
在配置文件的【参数表】中,根据需要填写采集参数和笔记图片&视频文件保存地址,如下图所示:
3、提前在谷歌浏览器中打开小红书首页( https://www.xiaohongshu.com/ )网址,并登录账号。
4、运行 RPA 应用:
点击 RPA 应用的运行按钮,在弹出的【运行参数设置】界面,选择配置文件和选择采集类型(关键词采集、博主主页采集、笔记列表采集或者高赞评论采集),勾选【记住内容】选项,然后点击【运行应用】启动。
执行中,RPA 应用先读取配置文件的参数,
1) 如果是关键词采集,则打开小红书网页,在【搜索栏】输入配置文件中填写的关键词,按笔记类型和筛选条件搜索笔记;机器人按照参数【采集数、点赞数阈值】,依次采集笔记作者的基础信息、笔记内容、然后批量下载图片 或者 视频。如此循环,采集所有填写的关键词对应笔记。
2) 如果是博主主页采集,则打开填写的博主主页,采集博主的相关信息,然后依次采集对应数量的笔记内容,批量下载图片 或者 视频。如此循环,采集所有填写的博主的相关笔记。
3) 如果是笔记采集,则打开填写的笔记链接,采集笔记作者的基础信息、笔记内容、然后批量下载图片 或者 视频。如此循环,依次采集所有填写的笔记链接。
4) 如果是高赞评论采集,则打开需要采集评论的笔记链接,先展开所有评论条目,然后根据【参数表】中设置的【评论高赞阈值】,采集相关评论。如此循环,依次采集所有填写的笔记链接的相关评论。
5、查看结果:
RPA 应用执行完毕,打开配置文件,在【笔记内容输出表】或者【高赞评论输出表】 查看采集记录。
启动参数说明
【配置文件名称】:填写或者选择配置文件对应路径和文件名;
【笔记采集类型】:从关键词、博主主页、笔记列表、高赞评论 4 种采集方式中选择。
【记住内容】:下次执行时,直接使用上次设置的参数。
配置文件参数说明
配套的配置文件(例如:小红书-智能内容采集.xlsx)有4个输入表、1个参数表和2个输出表。
输入表一、【关键词列表】,内容格式如下:
如上图所示,填写需要采集相关笔记的关键词。
输入表二、【博主主页列表】,内容格式如下:
如上图所示,填写需要笔记的特定博主主页链接。
输入表三、【笔记列表】,内容格式如下:
如上图所示,填写需要采集的特定笔记(比如爆款笔记)链接。
输入表四、【高赞评论采集表】,内容格式如下:
如上图所示,填写需要采集高赞评论的特定笔记链接。
参数表,内容格式如下:
【起始行】:人工填写,针对【关键词列表】、【博主主页列表】、【笔记列表】、【高赞评论采集表】4个表格,默认值3;填写从第几行开始搜索关键词、博主主页链接、笔记列表和高赞评论采集表。
【结束行】:人工填写,针对【关键词列表】、【博主主页列表】、【笔记列表】、【高赞评论采集表】4个表格,默认值-1;填写从第几行结束搜索关键词、博主主页链接、笔记列表和高赞评论采集表。
【文件保存地址】:人工填写,填写笔记的图片 & 视频下载的保存地址。
【每个关键词/博主笔记的采集数】:人工填写,数值型,针对【关键词列表】、【博主主页列表】;填写每个关键词、博主笔记的采集数量。
【点赞数阈值】:人工填写,数值型,针对【关键词列表】、【博主主页列表】,点赞数大于阈值的笔记才进行采集。
【笔记类型】:人工填写,数值型,针对【关键词列表】;取值 1:全部;2:图文;3:视频。
【热度分类】:人工填写,数值型,针对【关键词列表】;取值 1:综合;2:最新;3:最热。
【评论高赞阈值】:人工填写,针对【高赞评论采集表】;点赞数大于阈值的评论才进行采集。
输出表一、【笔记内容输出表】,内容格式如下:
如上图所示,对应记录关键词采集、博主主页采集、笔记列表采集的结果信息;点击记录条目末尾的【打开本地文件夹】快捷方式,直接查看下载的笔记图片或者视频。
输出表二、【高赞评论输出表】,内容格式如下:
如上图所示,记录高赞评论采集的评论信息。
配置文件示例下载
在网页 https://z00ulbgsx9x.feishu.cn/drive/folder/CjQ6fLogilMXWzduyGDcezS6nW3 ,下载《配置文件模版_小红书智能内容采集.zip》。
注意事项
(1)需要在谷歌浏览器中先登录 小红书 的账号;
(2)应用运行过程中,不要操作鼠标和键盘;
(3)浏览器要先安装八爪鱼 RPA 自动化插件,安装方法详见官方文档:https://rpa.bazhuayu.com/helpcenter/docs/PLoQif
所需第三方软件
1、WPS
2、谷歌浏览器
安装 Python 库
针对本应用,需要用到2个Python库:requests 和 pillow 。
详细说明手册
https://z00ulbgsx9x.feishu.cn/wiki/ZzVsw01hjiutk7ksWL2c7qEanEc
版本
版本 1
2025-06-16
20250616,首次发布(V1.4)。