领英-消息列表数据抓取-[数阔]
指定日期范围和不同的收件箱,来批量抓取领英账号最新的消息内容
功能:
这款应用程序可以指定一个日期范围和不同的收件箱,来批量抓取最新的消息内容、日期、发件人的领英个人资料链接、简介标题及其他相关数据。它还能判断最新消息是你发送的还是收件人发送的,抓取的结果会保存在本地的 Excel 文件中,方便您进行分析。
运行参数:
(1) 浏览器选择:选择要运行的浏览器
(2) AdsPower浏览器ID:如果浏览器选择了AdsPower请输入要用于打开网页的AdsPower浏览器ID,支持输入多个AdsPower浏览器ID,采用换行分隔;非必填内容,不填写或填写了错误的浏览器ID,将使用谷歌浏览器打开该网页。
(3) 收件箱类别:对应收件箱的分类,可选择Inbox, Focused, Other, Archived, Spam.
(4) 邮件状态::根据消息的状态筛选消息。选项包括:全部消息、未读、好友消息、Inmail、星级
(5) 采集该日期之前的消息:从指定的收件箱中收集在所选日期之前或当天发送的最新消息。例如,如果您选择7月1日,应用程序将收集在7月1日之前发送的消息。
(6) 消息线程数:要收集的会话线程数,从所选日期开始并倒序。例如,如果您选择7月1日并请求5个线程,它将收集在该日期之前或当天发送的5个最新会话。
(7) 导出路径:选择要保存抓取数据的文件夹。
注意事项:
(1)启动应用前,请确保将要使用的浏览器中中已安装OctopusRPA插件,安装插件请参考:https://rpa.bazhuayu.com/helpcenter/docs/PLoQif
(2)应用运行过程中,不要操作鼠标和键盘;
(3)在浏览器中需要先登录好领英的网站账号,并将该账号的语言切换到英文环境。
(4)在运行应用程序之前,请确保安装以下Python包:requests、pandas、chardet和openpyxl。在客户端应用编辑页面,点击右上角的工具按钮并选择“Python库管理”。
运行效果:
将采集到的消息导出到对应文件路径
版本
版本 1
2025-01-23