高德-识别地址类型-精准识别B端C端G端用户-[织流]
自动读取 MYSQL 地址维度表,对接高德数据精准识别地址类型,快速判断用户属于 B 端、C 端还是 G 端,结果自动写入数据结果表。支持多机器集群模式运行,解决人工识别效率低、数据判断易出错、单机处理能力不足等问题,以高效精准的自动化流程、灵活可拓展的处理能力,为数据分析师、企业运营人员及 IT 运维人员提供有力数据支撑,赋能企业决策。
- 地址识别
- 用户身份
- 用户类型
- 市场
- 运营
- 地推
分享有奖
业务场景
【适用人群】
- 数据分析师:快速处理海量地址数据,辅助身份判断,提升分析效率
- 企业运营人员:精准区分 B 端、C 端、G 端用户,助力精细化运营
- 市场地推人员:精准定位用户地址类型,只跑该跑的用户,助力开单
【解决痛点】
- 地址数据身份识别难:手动判断地址类型及用户身份耗时耗力,易出错
- 数据处理效率低:大量地址数据处理速度慢,影响业务推进
- 单机处理能力有限:单机无法满足大规模数据处理需求,缺乏灵活性
【核心价值】
- 自动化提效:自动读取、识别、写入数据,大幅节省人力和时间成本
- 精准判断:基于高德数据精准识别地址类型,提升用户身份判断准确性
- 高扩展性:集群模式支持多机器并行处理,满足大规模数据处理场景需求
功能介绍(使用说明)
RPA应用功能
通过预先设置好的参数,自动打开高德网页版,输入用户的地址,采集此地址的相关数据(店铺名称, 类型, 联系电话)。(注:需要提前登录高德网页版)”
应用运行截图
运行逻辑图
启动参数说明
- MYSQL连接字符串:数据库的连接字符串, 可通过八爪鱼的数据库工具生成
- 维度表名称(读取):源数据的库名及表名, 格式: 库名.表名
- 结果数据表名称(写入):写入的结果表的库名及表名, 格式: 库名.表名
- 飞书机器人url:非必须, 如果多次破解验证码失败, 会阻塞程序, 发送通知, 等待人为处理
注意事项
- 需要提前登录高德
- 目前版本只支持从MYSQL读并写入回MYSQL
- MYSQL一定要创建好维度表与结果表, 建表语句会在下方提供!
- 维度表数据请自行导入, 主要提供的数据有两列, 1: search_key 传入高德的地址文本; 2: rn 爬取的顺序, 可以自定义, 未自定义时随机自增
示例附件下载
维度表建表语句:
CREATE TABLE `octopus`.`dim_spider_gaode_address_type` (
`country_name` varchar(2047),
`province_name` varchar(2047),
`city_name` varchar(2047),
`address` varchar(2047),
`search_key` varchar(4095),
`rn` int(11) NOT NULL AUTO_INCREMENT,
`machine` varchar(2047),
PRIMARY KEY (`rn`),
UNIQUE KEY `idx_search_key` (`search_key`)
) DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;
结果表建表语句:
CREATE TABLE `octopus`.`dwm_spider_gaode_address_type_incr_dt_ultra` (
`country_name` varchar(2047)
, `province_name` varchar(2047)
, `city_name` varchar(2047)
, `address` varchar(2047)
, `shop_name` varchar(2047)
, `shop_type` varchar(2047)
, `shop_number` varchar(2047)
, `search_key` varchar(4095) NOT NULL
, `update_time` timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
, PRIMARY KEY (`search_key`)
) DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;
运行结果预览
版本
版本 4
2025-06-19
修复一个小bug
版本 3
2025-06-16
使应用更健壮
版本 2
2025-06-13
优化部分逻辑, 使应用更健壮
版本 1
2025-06-13
首次发布