如何寻找杀手级AI应用?
AI技术生态日趋完善,从基础设施到平台到应用层,到垂直的智能代理。但如何识别独特的AI原生公司?

陈加兴
StrategyLogic创始人

陈加兴
StrategyLogic创始人
顶级风投机构Sapphire Venture基于对企业软件格局发展的研究1,给出了评估AI原生应用价值的5D框架,帮助构建者和投资者在应用层面思考AI的差异化,以聚焦细分市场。
目录概要
1. AI原生应用定义
基于AI能力、打破传统限制、自我强化设计和专有AI技术是AI原生应用的几大特征。
2. AI原生:演进格局中的临时标签
AI原生和曾经的互联网原生、移动原生一样,只是企业应用在技术演进中特定时期的一个分类;随着AI成为所有应用程序的核心构成,作为前缀的标签将逐渐淡出。但即使在未来的AI原生世界,价值创造并不会变化,强大的企业家仍然在于打造超越客户期待的产品和服务。
3. 评估AI原生应用的框架
从设计、数据、领域知识、动态性和分销模式五个维度展示企业软件现在存在的问题,解锁潜在的价值。
4. 未来发展
AI技术迭代速度快,尽管它大部分时候在增强现在的领导者,但推理、架构、交互等方面,都是过去的应用程序所没有的,相信未来会出现新的通过组合创新,在AI时代崛起的重要公司。
AI原生应用定义
AI原生(AI-Native)应用被视为企业软件市场的颠覆者,2024年该领域的投资金额、被投公司数量在激增,越来越多的AI原生应用开始取得收益。据Sapphire统计,ARR(经常性年收入)达到
AI原生应用意味着AI是用户使用体验的核心,而不是将其视为一种补充功能。在广泛研究和访谈了Canva、Glean、Meta、Runway、Figama、Abridge和其它公司后,Sapphire提供了四项更精确的定义:
- 基于AI能力:AI原生应用建立在AI能力基础之上,比如对大型数据集的学习、理解上下文和生成新的输出。
- 打破传统限制:AI原生应用提供的输出打破了速度、规模和成本的传统应用限制,实现了全新的可能性。
- 自我强化设计:AI原生应用的设计理念是不断演进,既包括底层模型的增强,也包括从真实世界数据中获得的反馈循环增强。
- 专有AI技术:AI原生应用涉及到专有AI技术,而不是100%使用现成功能,如微调开源模型、模型编排。
AI原生将有一个过程,并非一定要从GenAI能力开始。和本地系统到云原生应用的过程一样(如Adobe Photoshop、Microsoft Office),随着时间的推移,企业将慢慢地从云原生过渡到AI原生。
AI原生:演进格局中的临时标签
AI原生只是当下对应用分类的一个标签,勿须过度炒作。因为随着时间推移,就像现在已经不再谈互联网原生、移动原生,也越来越少谈云原生一样,随着AI成为市场上所有产品和服务的核心组成部分,AI这个前缀会慢慢消失。
在技术周期的早期阶段,需要区分快速增强、扩展现有产品和全新构建的创业公司,但随着时间的推移,企业在产品构建和组织形式上AI优先(AI-first)原则有多深入,就变得不再重要了。
即使在一个AI原生的世界里,价值创造的基本驱动力没有变化。企业必须深入理解客户的痛点,打造满足并超越客户需求的产品和服务。强大的企业家必须建立伟大的团队,并始终如一地执行。无论AI有多先进,也只是实现这些雄心壮志的工具,而不是寻找下一个钉子的锤子。
我们所做的每一件事,都必须非常重视最重要的工作、最重要的角色和需要为客户解决的最重要的痛点。客户是我们创新的主要来源。
——Emrecan Dogan,Glean产品主管
评估AI原生应用的框架
从2024年开始,Sapphire使用了一个由五个维度构建的框架来评估创业公司构建的AI应用。Sapphire预计到,企业应用的竞争将空前激烈,加上AI辅助开发正在快速缩短功能差异化的追赶期,只有专注在有价值的细分类别上创业公司,才有可能胜出。
这五个维度是企业软件现存着大量问题的领域,Sapphire对领先企业的研究提供了许多洞见,可以帮助创业公司评估问题和定义价值主张。
1 设计 Design
企业软件是一个数万亿美元的市场,每年都投入大量资金来提高运营效率和规模,但企业软件的用户体验一直是痛点:大量的设置、复杂的菜单和频繁的通知——功能齐全,但令人讨厌。设计将成为下一代企业软件的关键差异,GenAI带来的会话体验是颠覆式的,需要密切这项技术以下方面的应用。
1.1 交互模式创新
许多企业工具充满了大多数用户很少访问的强大功能,要么是不知道这些功能,要么是不知道如何有效地使用。通过使用自然语言——文本或语音——来描述需求,用户可以解锁更多现有的产品功能。
多模态GenAI的发展将提供更多机会,更高性能的语音和视频模型提供了创建、捕获和转换输入和输出的新方法,而不仅仅是鼠标点击和打字。
OpenAI最近发布了画布, Anthropic也推出了计算功能,尽管还处于萌芽阶段,但它们都指向了从聊天机器人到共同创造画布、从副驾驶到自动驾驶的潜在进化。
1.2 加速反馈循环
GenAI产品能力的挑战是输出的不确定性,初创企业需要从培训技术和用户反馈两方面,来更好地优化功能并提高开发速度。
在与产品负责人的交流中,除了经典的“点赞/差评”和基于星级的输出评级、人工循环检视,还有很多有趣的创造性监控方式,比如用参与性的方法来收集意图信号,例如分享、悬停时间、内容的更新和参与频率,复制+粘贴等。
以非侵入方式将反馈智能地集成到用户体验中的产品将更快地迭代,并改进其性能,以更好地满足用户的需求。
1.3 开发AI原生系统
AI原生应用公司给我们留下深刻印象的是,他们在应用程序设计方面复杂的系统级思维,包括如何在AI商品组件包(无须再修改)、构建专有能力和基于特定用例优化性能之间进行平衡。它还涉及到混合使用基础技术(例如,微调、RAG、提示工程)和模型层的集成方法,如何在查询层实现最佳的性价比权衡。
AI原生应用简单的UI层背后,是大量的后端复杂性。必须评估创业公司在处理这些复杂性的设计能力。
一些印象深刻的AI原生应用包括:
- Perplexity.ai和OpenAI ChatGPT Search,通过整合相关的网页链接和引用来增强生成的响应。
- Hebbia和Reliant AI使用表格化的UI,让用户在更有针对性、更细粒度的层面上与输出进行交互,从而建立强大的反馈循环。
- Cognition提供了一个本地代码编辑器,用户可以直接在生成的输出中工作,根据首选的编码实践对模型进行微调。
- Rilla和Brand.ai使用多模态AI来重塑销售流程。Rilla分析客户对话以辅助改进(语音到文本),Bland.ai通过易于训练的数字代理(文本转语音)实现销售和服务电话的自动化。
2 数据 Data
数据对训练基础模型很重要,而模型是AI产品和服务的基础。数据在应用层同样重要,用于将基础能力商业化和围绕客户需求构建有护城河的产品。AI原生应用在处理数据方面,需要关注以下几种方式。
2.1 严格的端到端数据管理
没有数据战略就没有人工智能战略。虽然AI原生应用程序受益于基础模型,包括整合产品的全球数据、客户数据资产的现代化改造,但数据管理在最佳实践上仍然有强大的差异。
这体现在数据采购和管理、数据质量、数据治理和数据安全。此外,随着多模态模型能力的发展,处理跨结构化和非结构化数据的能力将成为最大化GenAI潜力的必要条件。以安全的方式更智能、更快速地收集、清理和整合数据的公司将会获胜。
2.2 解锁潜在数据价值
许多公司知道他们的数据有价值,但如何转化其价值仍然是一个挑战。与GenAI公司领导的交流中,一个常见的主题是他们的产品解锁了多少处于休眠或未捕获的客户数据,使客户能够:
更无缝地与现有数据进行交互;
- 更快速地访问适合自己角色和特定需求的最佳内容;
- 为数据资产带来更多的结构和定义的分类法。
这些有助于客户更好地理解如何使用数据来创造商业价值,并有效驱动了进一步的行动:
- 优化数据架构以支持更多的人工智能投资;
- 向值得信赖、展示了早期ROI的AI原生应用合作伙伴提供更多数据。
2.3 创建新的专有数据集
GenAI在现有数据之上可以捕获新的数据集,这形成了相对于现有应用程序的竞争性差异。包括多模态参与数据,AI生成内容的创建和消费元数据,微观和宏观层面的数据模式识别,等等。
这些数据是传统应用没有的。因此AI原生公司有机会围绕它创建一个整合点,并构建差异化的工作流程,从而扩展其价值。
然后,这些新数据和对用户工作流的理解可以转化为训练数据,迭代地改进底层模型的性能,从而扩大AI原生挑战者的竞争优势。这种飞跃突显出,赋予优势的不再仅仅是数据量。
展示出强大数据管理和利用的AI原生应用包括:
- Glean训练定制的LLMs并构建组织特定的知识图谱,使用实时反馈为每个用户提供个性化的、与上下文相关的搜索结果。
- Writer利用专门的LLMs来深入了解企业数据之间的语义关系,并为任意搜索或应用程序查询检索相关的、上下文感知的结果。
- Jeeva.ai将来自多个来源的销售线索数据“空中”统一起来,使用户能够精细地定义他们的ICP,快速构建准确丰富的潜在客户列表,并生成高度个性化的消息来自动分配。
3 领域知识 Domain Expertise
过去一年,垂直AI应用是人们的讨论焦点,特定行业的AI原生应用已经成为扩张最快之一,显著体现在法律、医疗保健、房地产和金融服务等领域。GenAI展现出了对深度领域的理解能力——不仅在特定的产品交互中,也在端到端工作流程中——这个进展将打破现有的软件类别,包括从垂直和水平两个方向的分类。在评估这个维度时,要考虑应用程序以下能力。
3.1 将领域特定活动转换为AI加速的工作流
垂直AI发展迅速的一个原因是,GenAI被证明有能力为特定领域的最终用户活动创建更好的数字化呈现。在与创始人和产品领导者的交流中,我们听到了许多实践案例,包括更准确的客户对话翻译/转录(例如,在医患交流中),更可靠的研究输入摘要(例如,在法律研究和财务中),对用户对用户和用户对实体关系的更精确理解(例如,在企业搜索中)。GenAI模型还在训练更多的场景,以深入了解围绕单个任务的行业/特定功能的上下文,然后自动执行操作,让用户更快、更有效地获得结果。
通过与几位产品和工程领导进行交谈,他们认为将成熟用户的使用方式及见解,通过GenAI提示词和结构化输出,共享到整个组织,可以形成提升整体员工基础能力的知识转移方式。
3.2 快速、大规模的综合能力
AI原生应用程序的另一个优势是能够近实时地从海量数据集中获取见解。许多领域都出现了新的AI原生应用程序,结合了对经过验证的行业特定文档和数据(例如SEC EDGAR数据库)的访问,微调模型和基于聊天的界面,加快了客户识别和处理与特定目标相关信息的速度。到目前为止,这种趋势可能在法律领域最为明显,比如Harvey、EvenUp、Robin AI和Supio。在医疗保健、公共部门、保险、金融服务和教育领域也看到了同样的模型。
AI原生应用程序在与特定领域请求相关的一个或多个维度上为用户提供超人的能力。毫不夸张地说,过去需要大型团队(通常是初级员工或外部顾问)数天或数周才能回答的问题,现在至少可以在几分钟内解决部分问题。
3.3 结合全球和本地知识
AI原生应用程序具有独特的定位,可以结合三种类型的知识:通过大量训练数据嵌入基础模型的全球知识,存在于行业相关数据库中的特定领域知识,以及来自组织自有档案的企业特定见解。关于后一点,领域专业知识可以反映在高质量的演示文稿、备忘录、会议记录、专题研究、培训材料和历史文档中,用于优化AI原生应用程序输出,以符合用户对“参照物”的期望。
这不仅仅是对专有数据访问方式的优化,而是对数据如何反映员工、团队或组织在特定环境中的相关知识的理解。这种组合释放了用户从优化单个任务到自动化整个工作流程的潜力,同时专注于更具体的结果。
通过深度的领域见解成为一流垂直AI应用包括:
- Abridge将实时患者音频转换为精确的临床笔记,采用基于大型医疗对话数据集的多LLM架构进行训练。
- EliseAI利用LLMs从物业管理系统(PMS)、CRM、知识库和从租赁专业人员那里获取有关住宅建筑的相关信息,自动回答潜在和现有租户的问题。
- Supio有一个基于人身伤害案件大型数据集训练的专有模型,使其能够分析和生成高精度的法律文件。
- Magic School提供80多种AI工具,用于帮助教育工作者改进和自动化课程规划、评估写作、学术内容生成/管理等。
4 动态性 Dynamism
Meta通过GenAI加速了多模态动态广告的创作和测试,并通过新的Imagine Yourself模型实现了下一代个性化内容,将对数字营销和商业领域产生潜在影响。
GenAI将提高用户对企业软件的期望值。虽然不像前面三个维度那样通用(例如,在处理总账时,你不想要太多的动态性),但希望看到从静态到更动态的应用程序体验的转变。
4.1 优化“底层”操作:价格 vs. 性能实时优化的权衡
大多数公司已经使用模型编排而非单个模型,来优化给定用例的输出,输入到输出的过程变得更具动态性。基础设施的灵活性,允许企业轻松地替换模块化组件,以实现性能改进和/或成本效率。这种动态性使得Martian这样的模型路由器公司兴起,作为支持AI本地应用程序的基础设施堆栈的新关键组件。
随着时间的推移,希望出现更高级的AI功能,这些功能目前还是由用户操作(例如,在ChatGPT或Perplexity中选择底层模型、输出音调、评分输出),未来可以由底层系统帮助用户自适应。
4.2 创建生成式客户旅程
如设计维度提到的,企业软件用户体验往往表现不佳。我们设想的一种改进方式,是通过创建更动态和适应性更强的内容体验来表达对最终用户和客户更深入的理解。如根据个人潜在客户的偏好调整的销售和营销宣传材料——从外发电子邮件到推介会,到登录页面,再到合同创建。如商业平台,使购物者能够在自己的物理空间的数字孪生或在自己的数字化身上看到商品。
想象在不久的将来,应用程序“将成为实时、持续学习的系统,人工智能将根据客户互动自主适应。”从长远来看,可能会看到整个用户界面都是实时生成的,根据用户意图的表达,显示和隐藏潜在的功能和内容。
4.3 在多个级别上启用超个性化
企业软件可以提供更多个性化体验。包括公司内部的最终用户、团队、部门和组织层面,因为AI会学习相关的偏好、参与模式和关系。例如,Outreach为组织中的每个团队和卖家建立了一个定制的获胜模型,该模型会随着交易的进展而实时更新。此外,销售沟通和宣传材料正变得更加适合单个客户。随着时间的推移,我们相信拥有共享记忆的代理将代表这一主题的最充分表示。
展示动态性的案例包括:
- HeyGen提供的AI视频创作平台,使GTM和L&D团队能够快速生成非常个性化的视频内容,并在销售、支持和培训中部署完全自主的对话式视频体验。
- MeMercor创建了一个AI面试官,可以实时评估候选人,利用预处理的简历和个人资料数据,同时适应现场对话。
- Evolv AI通过AI驱动的实验不断实时适应用户体验,基于实时用户行为优化客户旅程。
5 分销 Distribution
最后是关于这种新的AI价值定价和商品化的讨论。GenAI是否会降维打击到云时代备受欢迎的SaaS?我们认为有关软件即将消亡的报道被过分夸大了。虽然现在判断是否会出现一种主导模式还为时过早,但很明显,新公司正在实验,它们在平衡新价值和成本的同时,也要减轻潜在的新竞争威胁。我们关注AI原生应用与价值之间的以下关系。
5.1 提高定价和商品化灵活性,最大化价值
我们发现目前提供定价的情况非常多样:
- 不增加额外成本的情况下,将GenAI功能嵌入到现有服务中(例如,Workday);
- 为现有产品创建高级SKU,提供GenAI功能;
- 交付全新的独立GenAI应用程序;
- 在基础平台的合约基础上,测试一些基于消费和结果的产品。
GenAI的“主导”分销模式尚未出现。但我们认为GenAI作为一种技术,可以扩展公司交付满足客户需求的价值的方式,虽然可能因类别而有很大的差异。未来很可能包括应用程序和代理的混合,以及副驾驶和自动驾驶。
与“非此即彼”的定价争论不同,我们相信将有基于帐户(seat-based)、基于消费(consumption-based)以及更有选择性地基于结果(outcome-based)的定价组合。
能够平衡不同模型以确保客户覆盖范围的应用程序开发人员,同时更透明地将定价与交付的价值结合起来,将最有可能赢得未来的胜利。
5.2 赋能新的商业模式
软件赋能服务(software-enabled services)和代理系统在增长和崛起,真正的颠覆绝不仅仅是产品技术能力的一个功能,还经常包括商业模式的变化(例如,从许可证到订阅软件的转变)。
许多公司已经引入了新的定价方法,包括基于消费和基于结果的方式。一些值得关注的案例:
- Salesforce宣布其Agentforce套件的定价为每次对话2美元,Zendesk现在对每个自动解决方案收费1.5-2美元。
- Sierra、MavenAGI、Decagon和Crescendo等客户服务AI代理根据结果(例如,已解决的问题)进行定价。
- Reserv提供AI驱动的索赔处理服务,并根据已开立和已执行的索赔数量定价。
- 内容生成应用如Synthesia按生成视频分钟数收费,内容编辑工具如Imagen和Aftershoot按编辑次数收费。
未来发展
我们相信这个框架为构建者和投资者提供了一个强大的视角,让他们能够思考AI应用层的差异点。然而,真正的突破将来自那些以新颖的方式融合这些维度,从根本上重新构想工作的企业家。用更先进的功能改造现有的产品仍然是必要的,并将创造巨大的价值,但从长远来看,重新发明才是达到或超越当前企业软件领导者的公司所必需的。想想单一画布,通过“永远在线”的多模态程序,将不同服务的功能整合到一个单一体验中,并在一定的基础上定价。
从当下到潜在的未来,需要对技术堆栈的每一层进行重大改进,并且基于扩张定律(scaling law)的隐含假设,至少某种程度上,在未来几年内,前沿模型的能力将得到持续改进。还有一项艰巨而不那么引人注目的工作,就是以提高性能、减少幻觉、确保一致性、保持合规性、提高安全性和管理成本的方式解决现有模型的问题。
虽然GenAI的精确轨迹仍然不确定,但我们有理由认为,它的能力不会保持不变。所以,如果从“什么是正确的”的角度考虑未来,我们能看到什么?企业软件在未来几年将如何转变?
无论哪种方式,我们都将更清楚地看到,在接下来的几年里,什么可行,什么不可行,代价是什么。构建和购买GenAI技术的公司将能够相应地进行规划。虽然他们是“自言自语”,但我们同意Sam Altman和Greg Brockman的观点,即模型能力将继续发展,构建AI应用程序的公司应该在这种假设下运作。
然而,正如我们在最近几个月所看到的,我们不一定需要看到一个型号名称背后的更高数字来点燃人们对AI未来的兴奋。当我们询问产品负责人未来几年最让他们兴奋的是什么时,他们谈到了推理研究的方向,以及这可能如何加速从核心理解到更深层次思考到真正的代理系统的进展。
采取行动的模型,需要更多时间思考的模型,以及“追赶”文本进步的其他模型,都将进一步扩大应用程序在我们框架中跨维度区分的机会,几乎肯定会有新的研究领域作为补充。这一切都将引领应用层实验的新时代,我们对此感到无比兴奋。构建者的调色板似乎每周都在扩展,他们现在可以通过以前没有的方式混合产品架构、模型、用户界面、公共和私有数据源以及交付机制。变化的速度让人感觉无情。
也就是说,道路将是不平坦的。我们认为,在许多领域,广泛部署的进程可能需要比预期更长的时间。许多(如果不是大多数的话)重塑工作流程的实验将会失败,AI可能会加强许多软件类别中的现有领导者,而不是颠覆现有企业。然而,通过快速集成和新功能来展示组合创新的应用程序和代理公司,将把自己定位为定义即将到来的AI软件时代的重要公司。