高德-识别地址类型-精准识别B端C端G端用户-[织流]

高德-识别地址类型-精准识别B端C端G端用户-[织流]

自动读取 MYSQL 地址维度表,对接高德数据精准识别地址类型,快速判断用户属于 B 端、C 端还是 G 端,结果自动写入数据结果表。支持多机器集群模式运行,解决人工识别效率低、数据判断易出错、单机处理能力不足等问题,以高效精准的自动化流程、灵活可拓展的处理能力,为数据分析师、企业运营人员及 IT 运维人员提供有力数据支撑,赋能企业决策。

  • 地址识别
  • 用户身份
  • 用户类型
  • 市场
  • 运营
  • 地推
分享有奖

业务场景

【适用人群】

  1. 数据分析师:快速处理海量地址数据,辅助身份判断,提升分析效率
  2. 企业运营人员:精准区分 B 端、C 端、G 端用户,助力精细化运营
  3. 市场地推人员:精准定位用户地址类型,只跑该跑的用户,助力开单

【解决痛点】

  1. 地址数据身份识别难:手动判断地址类型及用户身份耗时耗力,易出错
  2. 数据处理效率低:大量地址数据处理速度慢,影响业务推进
  3. 单机处理能力有限:单机无法满足大规模数据处理需求,缺乏灵活性

【核心价值】

  1. 自动化提效:自动读取、识别、写入数据,大幅节省人力和时间成本
  2. 精准判断:基于高德数据精准识别地址类型,提升用户身份判断准确性
  3. 高扩展性:集群模式支持多机器并行处理,满足大规模数据处理场景需求


功能介绍(使用说明)

RPA应用功能

通过预先设置好的参数,自动打开高德网页版,输入用户的地址,采集此地址的相关数据(店铺名称, 类型, 联系电话)。(注:需要提前登录高德网页版)”                                                                                                                                                                      


应用运行截图


运行逻辑图


启动参数说明

  1. MYSQL连接字符串:数据库的连接字符串, 可通过八爪鱼的数据库工具生成
  2. 维度表名称(读取):源数据的库名及表名, 格式: 库名.表名
  3. 结果数据表名称(写入):写入的结果表的库名及表名, 格式: 库名.表名
  4. 飞书机器人url:非必须, 如果多次破解验证码失败, 会阻塞程序, 发送通知, 等待人为处理

注意事项

  1. 需要提前登录高德
  2. 目前版本只支持从MYSQL读并写入回MYSQL
  3. MYSQL一定要创建好维度表与结果表, 建表语句会在下方提供!
  4. 维度表数据请自行导入, 主要提供的数据有两列, 1: search_key 传入高德的地址文本; 2: rn 爬取的顺序, 可以自定义, 未自定义时随机自增

示例附件下载

维度表建表语句:

CREATE TABLE `octopus`.`dim_spider_gaode_address_type` (
  `country_name` varchar(2047),
  `province_name` varchar(2047),
  `city_name` varchar(2047),
  `address` varchar(2047),
  `search_key` varchar(4095),
  `rn` int(11) NOT NULL AUTO_INCREMENT,
  `machine` varchar(2047),
  PRIMARY KEY (`rn`),
  UNIQUE KEY `idx_search_key` (`search_key`)
) DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

结果表建表语句:

CREATE TABLE `octopus`.`dwm_spider_gaode_address_type_incr_dt_ultra` (
  `country_name` varchar(2047)
  ,  `province_name` varchar(2047)
  ,  `city_name` varchar(2047)
  ,  `address` varchar(2047)
  ,  `shop_name` varchar(2047)
  ,  `shop_type` varchar(2047)
  ,  `shop_number` varchar(2047)
  ,  `search_key` varchar(4095) NOT NULL
  ,  `update_time` timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
  ,  PRIMARY KEY (`search_key`)
  ) DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

运行结果预览


版本

版本 4

2025-06-19

修复一个小bug

版本 3

2025-06-16

使应用更健壮

版本 2

2025-06-13

优化部分逻辑, 使应用更健壮

版本 1

2025-06-13

首次发布