从数据到决策:独角兽Hightouch案例研究
目前许多据实践仅仅是流程优化,企业经营和组织形式是多种多样的,作为杠杆点的技术利用也不尽相同。

陈加兴
StrategyLogic创始人

陈加兴
StrategyLogic创始人
近两周与数家央国企交流AI战略,客户都谈到了数据问题:我们有大量的数据,但不知道怎么用。最新的独角兽Hightouch——通过AI驱动大规模个性化营销,提供了从数据到决策的实践参考:反向ETL、数据激活、组装式用户数据平台和人工智能决策平台。
目前许多企业的数据实践仅仅是将数据用于流程优化。但企业的经营和组织形式是多种多样的,作为杠杆点的技术利用也不尽相同。并非每家企业都适用流程管理,或能够通过流程优化来大幅度改进组织效率。
例如电商平台的数据自动化更多是基于对象数据化而非流程:通过商品实体识别、包装及条码生成、仓库货架建模空间分割,完成全自动的包装、入库、上架、取货和发货,取代了整个供应商发货与仓库管理流程。
在这种意义上,数据驱动对流程驱动是替代关系,基于数据的算法发挥了自主决策的作用,无须人工参与或审批。
但从这些交流中发现了好的趋势。中国企业已经对复杂的技术战略有了更深的认知,开始从系统因果关系来思考AI应用的落地:它取决于数据利用的成效而不是最后的模型或算法。
Hightouch成立于2019年,是一家专注于销售和营销自动化的SaaS公司,凭借强大的数据处理能力,帮助企业实现客户数据的实时同步与分析,以提升销售和营销效果。2025年2月18日,Hightouch完成
Hightouch AI:大规模个性化体验营销
如何将大量数据转化为有意义的行动,一直是一个挑战。在营销领域,用户数据平台(CDP,Customer Data Platform)很早就有了,但它长期处于孤岛状态,缺乏在正确的时间向正确的用户提供正确的信息的能力——用户仍然在流失,导致企业错失增长机会。
🚧 启示:对许多构建了数据中台的企业来说,数据是否对业务有用、如何对业务产生价值,依然存在巨大的屏障。
Hightouch重新定义了工作模式,帮助营销人员在与客户交互的重要时刻传递针对性信息,从而提升营销效果:
- 组装式用户数据平台:将数据洞察转化为业务行动;
- 人工智能决策平台:同时满足个性化体验和规模化扩张。
下图的使用场景中,通过三个决策支持:内容、个性化和下一步行动,激发忠诚用户的复购率。
组装式用户数据平台(Composable CDP)基于用户数据来个性化、分析和优化营销活动,它改变了营销人员访问和激活数据的方式——只有数据是不够的,营销人员不仅仅需要统一的信息,还需要能够立即采取行动的系统,这正是Hightouch脱颖而出的地方。
人工智能决策平台(AI Decisioning)使营销人员的能力得以规模化,它将AI嵌入到平台中,把数据转化为可行动的见解。AI不依赖于预定义的规则,而是动态地生成每次与客户互动的最佳内容、时间和渠道。无论是基于浏览行为优化促销,还是通过电子邮件、短信和网页个性化内容,AI决策都能以一种我们从未见过的方式大规模地自动化这些决策。
根据Hightouch的官方数据,有821家企业在平台上管理着51,042,863个用户体验,平均超过62,000个,这是在传统营销模式下无法做到的,人工智能技术实现了个性化 x 规模化。
从Glean到Hightouch,AI技术加强的是拥有数据能力的企业。与Glean专注于非结构化的内容与知识检索不同,Hightouch更专注在结构化数据的集成、同步,以及它的特别之处:将数据洞察转化为业务行动,从而创造业务收益。
现代数据栈:解锁数据价值的技术基础
Hightouch AI并非一夜出现,而是不断迭代的技术解决方案。在成立之初,Hightouch的技术应用场景就非常特别。
当时大多数数据处理公司都使用ETL流程:将各个应用程序中的数据采集、清洗、集成到数据仓库的预置模型中。Hightouch恰恰相反,它是一种反向ETL(reverse ETL)工作流程,将数据仓库中的数据同步到应用程序。
ETL关系到数据仓库中的数据治理、数据质量,是数据处理中最繁琐、复杂,也是最重复的工作之一,做好ETL非常不容易。Hightouch何以轻松地实现反向ETL?它借助了数据处理技术的不断进步,尤其是大数据向现代数据栈跃迁1,技术、工具与工程师的解放,使得数据价值的释放,一步步成为可能。
现代数据栈历程
2010年之前,云计算还未广泛采用,建立以数据为中心的组织需要购买昂贵的硬件或服务器,Oracle占据着数据库厂商垄断地位。随着Hadoop、Postgres构建的开源数据库框架兴起,企业意识到在管理和存储数据方面有了更多的选择,但这些技术还非常笨重,在上面构建分析应用也非常耗时。
2012年,AWS Redshift改变了整个数据库领域——它是第一个运行在云端的大规模并行处理(MPP)数据仓库,相对于动辄百万美元的传统数据仓库,它非常便宜,每个企业都负担得起。
2016年,受到Redshift启发,Snowflake兴起,数据库再次发生重大变化——它成功地实现了存算分离,将云端数据仓库提升到一个更高的水平:完全托管的分析SaaS平台,比Redshift更便宜。
Snowflake的快速普及,使数据工程师很快意识到他们不再需要ETL工具,而是直接将原始数据加载到Snowflake仓库中,再进行转换。这产生了一个全新的ETL过程:使用数据仓库的能力进行转换。
因此,伴随着云技术和一系统新的工具出现,现代数据栈诞生了。
与传统数据栈的区别
传统数据栈和现代数据栈之间的核心区别在于本地硬件和云原生工具之间的差异。传统数据栈托管在本地,必须根据业务需求的变化单独配置、管理和扩展硬件。
现代数据栈托管在云中,所有底层的硬件维护都是自动化服务。基于云计算和SaaS的工具为用户消除了巨大的工作量,使他们能够专注于业务成果,而不是技术。
SaaS平台提供了巨大的规模经济,因此,现代数据栈的成本效益也要高得多,因为用户只需为使用付费,不需要自己购买底层资源。
现代数据栈是集中式和组装式的分析平台,处理从采集、集成到持久化的端到端数据流——每一层都以分析为中心。这意味着每个产品或SaaS工具是大型体系结构的一个独立的、可配置的和可互换的组件。应该基于简单性、速度和可扩展性来选择单个工具。
- 简单性:该工具使用起来有多容易?它是完全托管/SaaS和基于SQL的吗?
- 速度:该工具的速度和性能如何?
- 可扩展性:工具是否可以根据期望的用例进行伸缩?
数据编排和数据激活是这一云端分析架构下的新兴技术概念。
数据编排(Data Orchestration):由于现代数据栈中的层以及管道,管理各层之间的依赖关系、调度数据作业和监视所有内容非常困难。数据编排通过自动化和工作流来解决这个问题,数据团队可以定义具有各种依赖关系的任务和数据流。
数据激活(Data Activation)专注于解决现代数据栈中的“最后一英里问题”。一旦数据被持久化到仓库中,它唯一存在的地方就是仪表板或报告。可视化对管理层可能有用,但不太适用于各种业务团队。
数据激活正是Hightouch技术解决方案的核心应用场景。
数据激活:场景驱动的解决方案
现代数据栈为数据团队释放了巨大的潜力:更好的工具和软件降低了构建和维护数据系统的时间,使数据团队能够更专注于为组织提供价值。
与此同时,Hightouch看到了一个新的挑战。随着每个业务功能对更多个性化数据的需求不断增长,业务的复杂性也在不断增加。作为数据团队,不需要再关心如何跨多个系统处理大数据。现在关注的是一个更困难的问题:业务复杂性。
首先,业务用户和团队并不使用数据仓库——他们工作在另外一组不同的应用程序中,在这里,整体的数据视图很难获得。
场景一:跨域数据复制
熟悉应用程序系统设计的人都知道,不同的子系统中经常会有交叉、重叠的对象实体,它们最后会映射为需要同步的数据实体。典型例子是销售合同和售后服务合同中的产品实体,在销售合同创建后,它需要被完整地复制到售后数据库中。
Hightouch的反向ETL解决的正是跨领域厂商解决方案的该类似场景的问题。
例如,一家公司服务客户ABC,销售和服务合同通过Salesforce签订,但ABC客户的售后服务请求在Zendesk上管理,两个平台的数据在默认情况下是未打通的。
为了让销售团队了解客户有过哪些售后服务请求,以便于提供更好的未来服务,他们需要方便地查看Zendesk请求数据。
Hightouch的工作是将Zendesk同步到数据仓库中的请求数据,反向同步到Salesforce,从而为销售团队提供更完整的客户视图。除此之外,它还能够进一步将Salesforce中的数据向Jira进行复制,为销售团队生成一个可以跟踪的任务。
看似“反模式”的数据集成方案却获得了大量的客户需求。在2021年,Hightouch就打通了约60多个集成“目的地”,从而形成了一种有别于任何一家ETL公司的数据栈产品。
场景二:连接业务效果
生成报告和BI是朝着正确方向迈出的一步,但它不是最终目标。随着销售、市场营销、财务、运维和其他业务团队开始看到仓库中数据的价值,他们希望的不仅仅是报告,而是把数据输入到他们的应用程序中,对这些数据采取行动,从而实现更高层次的目标。
Hightouch将该使用场景定义为数据激活(Data Activation)2:
数据激活是一种解锁数据仓库中的知识的方法,使业务用户可以在日常工具中对其采取行动。通过数据激活,数据工程师更加以业务为中心,将他们的工作与业务结果直接联系起来。
许多衡量数据团队的指标是产出物(表格、报告和模型)而不是业务结果,数据激活却直接衡量对业务成果的贡献。例如,数据团队创建了一个模型,用于发送个性化的电子邮件,它直接衡量点击率和转化率的增长,并与数据团队的工作关联起来。
数据激活还可以将模型对潜在客户的评分、排序,直接同步到CRM系统中,从而帮助销售团队提高转化率和成交率。
更广泛的业务应用支持包括:
- 营销:同步自定义受众用户到广告平台,以重新定位或找到相似的受众用户;
- 销售:扩展Salesforce或Hubspot中的数据(例如线索评分,LTV,产品使用数据等);
- 支持:使用产品粘性数据来减少客户流失或识别追加销售机会;
- 财务:使用最新的库存数字更新ERP,并将客户数据同步到预测工具中。
Hightouch认为仅仅提供数据分析或BI工具,即使声称这些工具都是自助式的,都不足以为组织提供足够的价值,数据激活不是简单地分析数据以做出基于数据的决策,而是将重点从理解数据转移到对数据采取行动。
决策问题:个性化 vs. 规模化
Hightouch将人工智能的决策问题3定位到为每一位用户单独决策的困难性:
每个企业都渴望创造更多的“超级客户”——那些与他们的产品或服务深度互动,贡献可观收入,并长期保持忠诚的客户。但对于营销团队来说,实现这一愿景说起来容易做起来难。
每天早上,营销人员都面临着大量的选择:吸引哪些客户?什么样的内容会引起共鸣?用哪个报价?通过哪个渠道?在什么时候?
大量的选择导致营销人员不断地与困难的、往往是武断的决定作斗争。
像电子邮件、短信和推送通知这样的工具可以很容易地接触到任何客户,但营销人员如何知道哪些因素的组合会真正影响客户的行为?有了无限的可能性,没有一个团队,无论多么熟练或人员多么充足,能够为每个客户手动测试每个选项。
如果人类不能独立解决这个问题,也许人类和人工智能可以一起解决?这就是Hightouch AI决策平台的设计动机。
它适用的问题包括:
- 航空公司追求高利润的追加销售或交叉销售;
- 零售商推动用户复购和LTV增长;
- 提高订阅用户粘性以防止用户流失。
Hightouch AI决策的工作原理包括:
- 自动化实验:人工智能决策不断测试不同的消息、服务和时间区间,以找到与客户最好的互动方式。
- 个性化决策:AI决策不是围绕受众、时间或顺序手动定义规则,而是分析所有数据,为每个客户单独确定最佳方案。
- 持续学习:使用AI决策,每个决策都是持续学习循环的一部分。系统不会只做一个决定就继续前进;它不断地进行预测和实验,从中学习,并随着时间的推移调整策略以提高性能。
这种自动化、实验和优化的强大融合使组织能够专注于他们最擅长的事情——制定战略和创造——而人工智能决策则为每个客户处理实验、分析和决策的繁重工作。
案例总结
Hightouch并非一步到位的AI应用或数据平台。恰恰相反,它的构建是基于现代数据栈诞生的新技术机会,特定的反模式技术使用场景,在此基础上,跟随着客户应用的驱动一步步形成独特的数据栈产品。
对中国企业的启发如下:
- 采用先进的技术栈是基础。先进的技术往往是最简化的技术,如果没有对技术底层操作的简化,上层应用的构建复杂度会倍增,技术团队离业务价值就会更远。
- 专注解决问题的技术方案。数据复制、反向ETL都是传统软件工程中的反模式,但它在处理性能大幅度提升之后,不再是过去技术的关注点,因此,许多设计思想需要与时俱进。
- 场景驱动差异化产品竞争力。复杂性是现代应用尤其是AI应用的典型特征,驾驭复杂性的能力使技术团队、创业公司脱颖而出,但找到独特的场景,基于复杂性满足客户多样性需求的产品能力,在产品复杂性上持续整合新技术的能力,才是AI应用的真正护城河。