携程价格批量抓取
面向携程酒店数据采集:按酒店/日期/房型维度抓取价格、早餐、房型及代理渠道信息,满足数据监看与分析场景。适用于酒店收益管理人员、酒店运营人员、OTA运营、旅行社采购、酒店市场分析师。
- 数据采集
业务场景
【适用人群】
- 酒店收益管理人员、酒店运营人员、OTA运营、旅行社采购、酒店市场分析师
【解决痛点】
- 信息分散、重复手工整理,采价费时费力,难以规模化跟进价格波动。手动采集竞对与合作价太慢、太累、易遗漏,影响时效与准确性。
【核心价值】
• 效率提升:批量自动采集,相比人工效率提升10倍以上,一次可采集多个酒店
• 实时监控:定时抓取价格波动,支撑快速调价决策
• 数据完整:覆盖价格、早餐、房型、代理渠道、划线价格等多维度信息,无遗漏
• 精准比价:结构化数据导出至Excel,便于分析竞对策略与市场行情
功能介绍(使用说明)
RPA应用功能
- 通过预先在Excel的"配置信息"Sheet中填写好参数(酒店名称、酒店ID、入住/离店日期、房型筛选条件),RPA应用将自动打开携程网页,按配置逐个采集指定酒店的价格、早餐数量、房型名称、代理渠道、划线价格等信息,并将结果写入同一Excel文件的"酒店信息"Sheet中。
- 应用支持批量采集多个酒店,每个酒店可单独设置日期范围;房型列留空则抓取所有房型,填写关键词则按指定房型采集。
- (注:频繁采集可能触发携程平台的访问限制,建议合理控制采集频率和间隔时间;如需大量采集,建议分批次进行操作。运行前需确保已登录能够正常使用的携程账号。)
应用运行截图
(可采集字段:房型、日期、早餐数量、价格、代理商、划线价格等)
运行逻辑图
1. 读取Excel"配置信息"Sheet中的酒店列表
2. 打开Chrome浏览器并访问携程网站
3. 检查登录状态(需已登录)
4. 循环处理每个酒店:
- 访问酒店详情页(根据hotelID)
- 设置入住/离店日期
- 筛选房型(如有指定)
- 采集价格、早餐、房型、代理、划线价格、取消条款等信息
5. 将采集数据写入"酒店信息"Sheet
6. 完成并保存Excel文件
启动参数说明
1. Excel文件路径:选择包含"配置信息"Sheet的Excel文件(采集结果也将保存在此文件的"酒店信息"Sheet中)
2. 提前在Chrome浏览器安装好八爪鱼插件
3. 下载Python库:bs4
配置信息Sheet填写说明
• A列-酒店名称:填写酒店完整名称
• B列-时间区间:格式YYYY/MM/DD-YYYY/MM/DD(如2025/11/18-2025/11/22)
• C列-hotelID:携程酒店ID,可从酒店详情页URL中获取(如 https://hotels.ctrip.com/hotels/detail/?cityEnName=Shanghai&cityId=2&hotelId=44466080&checkIn=2025-11-18&checkOut=2025-11-19&adult=2&children=0&crn=1&ages=&curr=CNY&barcurr=CNY&masterhotelid_tracelogid=100025527-0a91dd52-489847-2798923&detailFilters=80%7C2%7E80%7E2&hotelType=normal&display=incavg&subStamp=774&isCT=true&isFirstEnterDetail=T 中的44466080
或https://hotels.ctrip.com/hotels/44466080.html?cityid=2#ctm_ref=www_hp_bs_lst 中的44466080
• D列-房型:指定房型关键词(如"豪华大床房"),留空则抓取所有房型,如果选择多房型,房型之间用“、”隔开
注意事项
1. 登录要求:运行前必须手动登录一个能够正常使用的携程账号,应用会保持该登录状态进行采集
2. 浏览器要求:仅支持Chrome浏览器,请确保已安装八爪鱼插件
3. 配置文件格式:必须包含"配置信息"Sheet,列名和格式需与说明一致
4. 酒店ID获取:从携程酒店详情页URL中复制数字ID(如479628),填写时仅填写数字
5. 日期格式:严格按照YYYY/MM/DD-YYYY/MM/DD格式填写,否则可能导致采集失败
6. 采集频率:避免短时间内频繁采集,防止被平台限制访问或者账号封禁
7. 网络稳定:运行期间请保持网络畅通,页面加载缓慢可能导致采集失败或数据不完整
8. 数据时效:建议定时采集以获取最新数据
9. 批量采集:支持一次采集多个酒店,在配置信息中按行添加即可
10. 结果核对:首次使用建议先测试1-2个酒店,核对采集字段准确性后再批量运行
示例附件
运行结果预览
采集结果存储在Excel的"酒店信息"Sheet中,包含以下字段:
• A列-酒店:酒店名称
• B列-日期:入住日期
• C列-房型:房型名称
• D列-早餐数量:早餐份数(如1份、2份、无早)
• E列-价格:房间价格(元)
• F列-代理有吗:代理渠道信息
• G列-划线价格:原价/参考价(元)
每个酒店的所有房型和日期组合将按行展开,便于后续数据分析和比价。
版本
版本 1
2025-11-18
主要功能特性 1. 批量采集:支持一次性采集多个酒店价格信息,提升采集效率 2. 灵活日期设置:每个酒店可单独配置入住/离店日期范围,满足不同采集需求 3. 房型筛选:支持指定房型关键词抓取或抓取所有房型,采集范围可控 4. 多维度数据采集:覆盖价格、早餐数量、房型名称、代理渠道、划线价格等关键字段 5. 配置与结果一体化:采用单Excel文件管理,"配置信息"Sheet填写参数,"酒店信息"Sheet自动输出结果 6. Chrome浏览器适配:基于Chrome浏览器自动化操作,稳定可靠