和水滴聊聊,怎么用大模型造一个接近 99% 真人水平的「Sales Agent」公司动态
不走通用大模型之路,通过垂直场景数据对模型进行微调、打造出能独立完成复杂销售工作的Sales Agent。
作者 | shiyun
编辑 | 郑玄
「保费 52 元是什么意思?」
「这个价格其实是根据您的年龄,以及您过去的病史,我们测出来的保费,您今年 43 岁,算下来每个月就是 52 块钱,是这样的。」
「之前被狗咬了也没报呀?」
「嗯嗯,这个是要根据您购买的保险条款来的,不是每个都能报的,能报的我们要看政策,所以您可以看到有的病也不能报。」
……
这一段对话,看起来平平无奇——但如果告诉你这是 AI 保险客服和用户进行的语音对话,那你一定会有点惊讶。
对话里,它完全能理解用户在问什么,能给出专业的回答,情商、智商都在线,声音像真人一样,语气和停顿自然、「嗯嗯啊啊」的废字都很真实。以至于用户在对话过程中感受非常顺畅自然,不会过于生硬。就这样,他们聊了 50 分钟——如果说图灵测试(注:1950 年图灵提出的,用于测试某机器是否具备人类智能的方法)是标尺的话,那这场对话几乎可以说 AI 已通过了测试。
电话那头的 AI 保险客服,是由水滴公司开发出的一款保险 Sales Agent。在人工智能领域,Agent 并不是直译「代理人」的意思,而是代表具备自主性、适应性、交互能力、能够自主学习和持续进化的软件或系统。
这家 2016 年成立的公司,业务聚焦在健康保障领域,2017 年推出了保险经纪平台「水滴保」,累计服务超 1.1 亿保险客户。
早在 2021 年,水滴就想做这样一款 AI 保险客服,对标真人水平、能弥补保险经纪人的服务供给不足问题。在 2022 年大模型浪潮到来之后,这个设想才真正提速了——根据通用基座模型以及水滴积累的优质保险语音语料库,它在一年内做出了这个媲美真人 99% 水平的 AI Agent。
衡量一个保险 AI Agent 是否真有用的标志,是看它是否走进了业务、带来了成交。水滴公司创始人兼 CEO 沈鹏告诉极客公园,该公司「意外险」、「医疗险」等险种的部分电话客服工作已经由 AI Agent 承担。
大模型浪潮这两年来,国内外科技公司都希望能拥抱大模型、改造自身业务,而水滴是一个典型代表。相比于倾注精力攻坚通用大模型、期望实现 AGI 的公司,像水滴这样,在已有底座大模型基础上、结合垂直领域数据微调,打造垂直模型和垂直应用的路径或许更为适用。它也能将智能推到某个极限,并且创造出商业价值。
在沈鹏看来,水滴要做的是大模型的中间层和应用层,更聚焦在保险产业的各种场景,不断优化大模型来提升内容生成的质量。为了加强在中间层和应用层的科技探索,水滴每年的研发投入在 3 亿元左右。
随着技术不断迭代,水滴推出的 AI Agent 也在不断升级。下半年,水滴又推出了针对车险场景更复杂的 AI 客服——除了对话能力,它还长出了更复杂的规划能力,比如能在车险售卖的数月周期内,像人一样规划 5-6 次跟用户打电话的内容,一步步挖掘用户的真实需求,进而协助经纪人促进用户购买。
它还有复杂的多模态和操作交互能力,能在跟用户沟通的同时,一边「看」保险系统的数据,一边用「手」输入和查询数据,一边「穿梭」于微信等不同的通讯软件间,协助经纪人,解答客户的疑问。
目前,水滴计划将这些保险 AI Agent 的技术能力打包成 SaaS 产品,向其他有大规模坐席客服岗位的行业输出解决方案。
极客公园在跟水滴相关负责人交流之后,能感受到这款 AI Agent 的复杂性,也了解了这款逼近真人水平的 AI 保险客服的诞生过程、以及背后的技术积累和迭代思考。从中,不仅可以看到水滴这家科技公司在大模型上的行进经验,另外对于 AI 能实现的惊人潜力,也被隐隐勾勒了出来。
01
正在「充分智能化」的
AI 保险客服
AI 智能水平的判断尺往往是人类。现在大模型的智能评价标准,也是能否达到真人水平。而水滴,造出了接近真人 99% 水平的 AI 保险客服,后者能跟人类通话 50 分钟以上、且对话过程非常顺畅,这到底是怎么做到的?
把这个问题抛给水滴公司 AI 研发与产品部的同事 Star,在他眼里,造一个「人」实际上是可以工程化拆解的问题。以保险经纪人为例,核心是三点,智商(IQ)、情商(EQ)、多模态交互能力,而这些都可以用数据训练出来。
一方面是智商(IQ),由于保险是一个相对复杂的业务,它的核心就是要理解不同保险产品的健康告知、保障范围、理赔条款等,结合用户的问题和情况,理解其上下文语义交互,给出合理的回复和建议。在这点上,AI 甚至能做得比人类更好。
比如在记忆力上,人类无法清楚、全面记住所有的保险知识,但 AI 能用知识库实现这一点。当用户问自己做开颅手术、得了糖尿病,保险能不能保,人类可能得支支吾吾、去查询一下相关条款。但 AI 能直接给出准确的答复。
另一方面是情商(EQ),这本质是一种情绪价值,能让人觉得对方懂自己、沟通中感到「顺畅」和「亲切」。目前市面上的大模型基本是问什么回复什么,没有给到太多情绪价值。在水滴团队看起来,情绪价值是人类特有的能力。但实际上,AI 也能学、甚至能比人类做得更好。
在实际案例中,有一位用户提到自己几年没出过车险了,一般经纪人可能会回「好的」。但 AI 保险客服回了一句,「哥,你技术真好」。这说明,它不仅完全听懂了该用户有安全意识、保险记录良好,并用一种超高情商的方式进行了回应。
最后,关于多模态交互能力,包括响应时间、音色、口语化等等。这同样是可以学习的,人语气里的「嗯嗯啊啊」、一般人说话会停顿几秒……AI 都可以从人类的通话数据中学习、模仿。同时,语音的训练也从原来的 TTS(文本转语音)变成端到端,这能生成更自然的对话。
在 Star 看来,能训练出这样的 Agent,最核心在于水滴过往积累的数据。水滴从成立起就定位为一家科技公司,每年的研发投入在 3 亿元左右、累积有数十项技术专利,并且一直有意识地积累数据。过往,水滴不仅积累了数 T 的优质语音语料库,而且数据质量非常高,提前做过语音清洗、很多语音甚至是双通道存储。这样的数据很多传统公司都没有。
本质上,水滴是在把这些数据去粗取精之后,相当于「用前 10% 经纪人的水平去训练大模型」,最终使得 Agent 能够达到中等经纪人的水平。
「科技与保险业的结合将越来越紧密,这是行业发展的必然趋势」,沈鹏表示,保险业已经进入由科技驱动的「数智化」时代,科技驱动保险业高质量发展,助力行业降本增效,能够为用户、保险机构、线下经纪人提供更高效的科技产品和工具,推动行业进一步发展。
02
用 AI 解决保险行业的供给端不足
早在 2021 年,大模型出来之前,水滴就希望用 AI 造一位保险客服。本质上,这是希望解决保险业的供给端不足问题。
保险业务占据大头的水滴,拥有众多保险经纪人。他们大部分卖复杂的重疾险、兼带着卖简单的医疗险等。这些保险经纪人的工作,核心是提供专业咨询和服务能力。当用户有保险购买意向后,给他们打电话,讲解产品、解答疑惑,最终促成用户下单。
然而,过去水滴发现,有些保险经纪人的服务供给并不足够好。保险条款规则复杂、细碎,人很难都记住。比如医疗险涵盖上百种疾病,用户问到其中一种,经纪人可能答不上来,而这会影响用户体验。同时,经纪人的服务供给往往参差不齐,头部 10% 的经纪人服务水平可能是尾部 10% 的数十倍。
团队想到,可以用 AI 打造一位保险客服,协助经纪人解决服务体验的问题。而基于对大数据和深度学习路线的相信,团队认为,通过保险经纪人优质语料的不断学习、技术上能让 AI 达到真正保险经纪人的水平。
他们定的目标很高,一定要逼近真人的水平,也就是说不是 Copilot(副驾驶)、一定是 Agent——一方面在于,只有这样的技术水平,产品才能大规模铺开。另一方面,AI 研发的成本过高,只有具备这样的价值、最终才能算得过账。
回看当时水滴提出的此目标,其实非常接近 AGI 的设想。AI Agent 几乎是这轮 AGI 梦想的起点,据极客公园了解,OpenAI 创立之初的愿景就是打造一个「无所不能」的 Agent,它能响应人类的指令、自主执行所有的操作。简单来说,就是像人一样。现在,经过两年的人工智能热潮,AI agent 也是目前市面上最热的 AI 应用方向。
但水滴做出这个设想时,技术还远远没有成熟。Star 介绍,2018 年,市场上还只有 1 亿参数开源模型。2021 年,只有数亿参数的可用开源模型。当时水滴基于这种技术底座做的 AI 保险客服,跟用户的对话时长只有 1-2 分钟。本质上,在底层 AI 通用能力没有达到的时候,上层的智能很难突破、也很难算得过账。
而 2022 年底 ChatGPT 大模型的出现,让一切按下了加速键。
看到 ChatGPT 后,水滴团队几乎立刻做出一个判断:只要手里有 ChatGPT3.5 水平的开源模型底座,结合水滴过去的保险经纪人语料库,一定能训练出一个接近真人水平的 AI 保险客服。他们认为开源的时间大概在三年左右,也就是说这件事将在三年内实现。
基于这个判断,水滴团队开始全力攻 AI Agent 方向。Star 认为,大模型浪潮给团队带来的直接影响是,让 AI 变成了「真正的智能」,这让整个公司给了他们更大的信心和支持。
这种支持除了来自 AI 研发上的资金投入,还来自于对行业最优秀人才的追逐。沈鹏介绍,人才是水滴最宝贵的资产,作为一家科技公司,水滴时刻关注前沿技术,也组建了一支既懂保险又懂人工智能的研发团队,核心成员均来自北大、清华、中科院等名校。
实际上,AI 的发展速度比想象中更乐观,当全球的科技公司都在追逐大模型,GPT3.5 水平的开源模型底座比想象中释放得更快。水滴团队通过计算判断,在这样的技术栈发展下,水滴 AI Agent 的智能水平平均每个月能提升 5%左右,大概一年内就能在部分医疗险场景达到人类保险经纪人的平均水平。
从 2022 年 11 月正式投入算起,到今年年初——团队用一年多的时间,实现了这个结果。
03
迭代,做更复杂的 AI 车险客服
上述具备逼近真人水平通话能力的 AI Agent,主要用于比较简单的险种,如意外险、医疗险等。2023 年,水滴自研出保险垂直模型「水滴水守大模型」,技术的累积让团队得以深入到更复杂的险种,如车险。下半年,团队旨在打造一个车险 AI Agent,其复杂度又上了一个台阶。
车险的场景一般是,在用户的车险到期前 1 个月,各家车险公司的客服会与用户联系、并后续多次沟通,说服他们买自家的车险。车险经纪人不能只是打电话,还得进行任务规划、巧妙沟通、执行操作等,AI 有接近一半的时间在做沟通准备、总结、客户资料分析等工作。这对 AI Agent 的考验更大了。
比如任务规划,它指的是在一定的销售期内,车险客服需要规划和用户沟通的次数。既不能过于频繁、以免招惹他们厌烦,也不能过于冷淡、以免丢失销售线索。
对应到 AI Agent,实际上要求它有更高的智商(IQ)。它需要自主规划沟通几次,应该什么时候沟通,分别聊什么样的内容。「整个系统特别复杂,一次出错,就没法走了。」Star 说。
又比如巧妙沟通,由于车险的沟通频次更高、沟通空间更大,这考验经纪人更强的沟通能力。比如怎么衔接上一次的对话、怎么应对顾客的讲价、怎么在满足顾客诉求的同时保证公司利益,这本质上要求 AI 有更高的情商(EQ)。
在 Star 看来,以上对 AI Agent 更高的能力考验,需要通过迭代底层模型、加上高质量数据的微调实现。
在底层模型上,由于该 Agent 能力要求更复合,因此不是单一模型能搞定的。团队需要用到不同的模型,结合不同模态、不同大小模型各自的优势。比如大模型推理能力强,小模型拟合场景数据能力强,多模态模型能进行更多用户信息识别等。在这款车险 Agent 背后,水滴用到了多个大模型。
另外,依然要做好高质量数据的微调。当某一项能力不足的时候,就去筛选更好的人工数据进行训练,直到训练出效果为止。
在上述能力之外,该 Agent 还需要进化出操作执行能力。比如在协助经纪人与客户沟通时,Agent 可能要进入保险后台查数据、输数据、算数据等;需要切换不同的软件界面,比如电话、微信、app 等页面,跟用户沟通;也需要理解每一次用户的不同需求,为下一次聊天做准备等等。
在 Star 看来,这主要用到传统的 RPA(机器人流程自动化)技术。它相当于让 Agent 长出了人的「眼睛」和「手」,能够一边「看」不同的软件界面、一边「动手」操作。
这背后,是水滴根据不同阶段的技术形态,对产品的不断迭代。从只能简单协助沟通医疗险种 AI 保险客服,到能自主规划、能看能动手的 AI 车险客服,水滴不断解锁更复杂的保险场景,推高技术和应用的上限。
目前,这些 AI 保险客服已经被用到了水滴的真实业务当中,可以为用户随时解答疑惑。「大模型带来的是全新的生产力,它带来的是供给侧改革,这是根本的变革。」沈鹏说。
过去,人们提到保险经纪人最不可替代的价值是「信任感」。由于保险条款复杂,一般人并不具备看懂、分辨的能力,只能选择相信保险经纪人。他们倾向于跟亲朋好友、从业多年的经纪人购买保险,因为他们更有「信任感」,不会欺骗自己。
Star认为,所谓的信任感,其实就是一种专业的服务能力。「当 AI 能协助提供更专业的服务,你也会信任它。」
有了这样的 AI Agent,人类保险经纪人的工作也发生了一些变化。他们中的有一些人,已经变成了 AI 训练师。而对于更多保险经纪人来说,他们开始将 Agent 作为自己的助手、为用户提供更复杂的保险服务,比如更长生命周期的保险规划等。
04
未来:从垂直走向通用
在大模型热潮的这两年里,国内外的科技公司都在思考怎么拥抱大模型,从而进行业务转型。水滴代表了一种比较主流的路径选择,不是投入巨大的资源攻坚通用大模型、直指 AGI。而是基于开源模型、结合垂直场景的高质量数据进行微调,打造自己的垂直模型和应用。
在跑通了 AI+保险这条新路径的「0 到 1」、「1 到 10」之后,接下来的「10 到 100」,水滴有两个方向的尝试。
首先是继续沿着垂直模型+保险场景的路径深挖。一方面,是继续提升 Agent 的能力,目标不是让它达到经纪人服务水平的「中位数」,而是要超越 60%-70% 的人。另一方面,要向更复杂的场景拓深,从现在的医疗险、车险,进入到重疾险等险种。而实现这些背后,还是依靠底层模型能力和优质数据的微调。
目前,水滴正在将 AI Agent 等系列产品,与保险行业的其他公司谈合作。或许在不久的将来,这家公司能打造所有险种逼近真人水平的 AI 保险客服。由点及面,或许有一天它能迎来保险行业的通用 AGI 时刻。
此外,水滴的目光也并没有只放在保险行业——一个很本质的问题是,具备真人保险经纪人水平的 AI Agent,能不能泛化到其他需要大规模坐席客服的行业?比如教育、电商等行业等?也就是说,垂直应用能不能逐渐走向通用?
团队判断,这是有可能的。原因在于,他们考察发现了两个事实:一、保险行业的销冠,只需要三个月就能转行去别的行业做销售。二、保险行业的销冠,也可以成为其他行业的销冠。
在人身上行得通的逻辑,在 AI Agent 也应该能行得通。目前,水滴团队正在将上述 AI Agent 服务能力打包为 SaaS 解决方案,测试在教育、电商、等行业推广的可能。在 Star 看来,虽然这套服务目前没法直接泛化到其他行业,但只要目标是确定可行的、坚持投入就能做成。
如果说过去的 SaaS 产品是按「坐席」收费,但大模型可能彻底改变 SaaS 产品的收费方式——直接按结果收费。对水滴来说,它可能直接从 AI Agent 的服务转化业绩中获益。目前,水滴已经获得了其他行业的一些意向客户。
从最初的业务需求出发,这家公司早在大模型浪潮之前,就看到了 AI 的最终愿景:一个接近真人水平的智能体,它会形成全新的供给、带来生产力的巨大变革。而赶上大模型的历史性机遇,它以坚定的相信和投入,慢慢接近了当初的目标:用 AI 造出了一位保险客服。
AI Agent 的技术输出是否会引发 AI 伦理担忧。对此沈鹏表示,科技助力行业发展的最底层支撑应该是价值观,科技没有价值观,但创业者有。要为 AI 科技赋予人性温度,才能打造出社会真正需要的产品和服务。
水滴探索出来的大模型之路,是中国科技公司的一个缩影。一边信仰、一边务实,从垂直场景慢慢走向泛化通用。而 AI 作为全新的供给、带来的这场生产力革命,也会从这家公司、这个行业开始,一直扩散到其他各行各业中去。这在不久的将来,是一定会发生的事情。
*头图来源:极客公园
*文章来源:极客公园