中国太保集团王磊:大模型探索要联合创新合作,实现资源互补、风险共担、成果共享公司动态
慧保天下—专业保险信息服务商(燕梳新青年信息科技)
/ 慧保天下 / 2024-01-03 15:17 /
编者按 12月21日,2023慧保天下数智保险专题研讨会在深圳正式拉开帷幕,主题为做好数字金融大文章,加快数智保险发展。在上午举行的主题演讲环节,中国太保集团数智研究院院长王磊发表了题为《保险大模型应用的探索思考》的主题演讲。 在演讲中,王磊指出,过去数字化赋能的主要方向在于传统的
编者按
12月21日,2023慧保天下数智保险专题研讨会在深圳正式拉开帷幕,主题为“做好数字金融大文章,加快数智保险发展”。在上午举行的主题演讲环节,中国太保集团数智研究院院长王磊发表了题为《保险大模型应用的探索思考》的主题演讲。
在演讲中,王磊指出,过去数字化赋能的主要方向在于传统的数字化技术,尤其是大数据+人工智能的技术在探索保险领域的创新应用。而通过大模型可以带来两个改变:一是通过大模型技术和传统数字化技术的结合,能够提升人员服务能力,具备更多复合型专家能力;二是可以大幅提升人员效率,能够提供更多等效劳动力。
他表示,相比数字技术,大模型技术是“人”的模型,具备理解、思考和解决问题能力,可以通过训练解决通用领域和专业领域的不特定问题,并可以操作完成相关任务,形成闭环服务。大模型技术为保险行业带来了包括更合理的成本结构、更优的客户体验在内的机会。大模型技术能够建设数字专家能力,打造领域专家能力,建设具备感知、规划、执行链路能力的数字劳动力。
面对大模型落地可能会面临的诸多挑战,他也分享了应对机制,即要与技术企业形成联合创新合作的机制,实现资源互补、贡献共担和成果共享,共同探索大模型在保险行业中的应用。
以下即为王磊演讲全文:
王磊 中国太保集团数智研究院院长
太保的数据研究院,主要面向云计算、大数据、人工智能、物联网、区块链等技术,定位也是如何用这些新技术创新性应用在保险领域里,为主业赋能。我们是技术团队,今天的分享更加聚焦在技术领域,所以我分享的题目是《保险大模型应用的探索思考》。
01
大模型:理性思考可闭环服务、部分替代人工降低成本
在过去的两年,数字化赋能的主要方向在于传统的数字化技术,尤其是大数据+人工智能的技术在探索保险领域的创新应用。
无论是大数据还是传统人工智能技术都存在着赋能的天花板,在保险领域面临的较大难题是虽然数据多,但数据实效性差、质量不高、维度少,以及保险领域全流程线上化程度和自动化程度不高,因此大数据应用周期长,也需要依赖于大量的外部数据,效果体现较缓慢。
在人工智能的领域里,会遇到什么问题呢?大量的人工智能用在识别,图像识别,OCR还有决策模型和预测模型用的是比较多的,但是真正遇到智能交互的场景,包括NLP技术在内的传统AI效果并不理想。
大模型跟传统的数字技术相比,具备更多的新能力,包括它的思考模式,原来无论在决策模型还是识别等方面,都是比较直接简单的判断。而大模型可以具备更理性、有推导能力的思考模式,可以通过规划能力、编写代码帮助完成行动,形成服务闭环。
此外,从模型训练的角度来讲,传统模型训练都是单个场景和任务,需要准备大量的语料。而大模型具备更强的泛化能力和通用性,可以基于较少的样本数据训练更多的场景。相比之下,原来只能做某个环节的智能,大模型出现之后,可能可以实现对于某个工作流程、工作岗位的建模,让大模型部分替代非创造类脑力劳动,降低人工成本。
这件事带来的改变对于保险行业来说,实际影响会非常大,原因有两方面:
一方面,保险行业是劳动密集型的产业,产品情况复杂多样,在服务客户、销售产品的过程中都需要投入大量人力来完成非标准化,不能纯粹靠用户自助来完成流程,需要巨大成本。同时对于员工的高要求,客户体验存在巨大偏差,从整个保险业成本结构也能看到,有效赔付给用户占比只有55%左右,理想占比应该更高,甚至到达90%,我们应该降低在渠道营销、管理运营包括应对欺诈方面的成本。在当下整个市场面临挑战的情况下,我们更应该坚持数字化智能的方向,有效优化成本结构。
另一方面,未来的市场趋势是体验经济,客户更追求个性化、专业化服务以及能够及时响应的服务,客户对服务体验的要求愈来愈高,通过传统的模式很难满足,这也是数字化赋能的方向。
02
太保大模型数字劳动力的两大特点及其具体应用探索
如果真正要去解决这些问题,通过大模型可以带来两个改变:一是通过大模型技术和传统数字化技术的结合,能够提升人员服务能力水平,具备更多复合型专家能力;二是可以大幅提升人员效率,能够提供更多等效劳动力。
具体来看,太保大模型的战略方向要打造保险领域的数字劳动力,具有两个特点:
第一是要具备一定的专业深度。所谓专业深度是指具备一定的学习壁垒,不是通过短期能马上掌握的能力,往往通过多年的专业培训才能得到的能力;从能力模式来看,不是通过简单的问答搜索能解决,而要通过对于知识理解掌握和推理能够解答问题;基于这种专业能力要能够辅助员工来完成他原来不能完成的专业性工作。具备这样的专业深度,就能够增强员工能力,让他成为复合型的超级员工。
第二是要形成服务闭环,不只是解答,要能够完成完整服务,要具备收集信息、理解思考推理和规划、行动能力,可以提供更多的等效劳动力,能够帮助员工完成大量重复性的工作。
复合型专家能力在保险场景无处不在,在整个场景我们需要各种各样的专家,包括像保险产品专家、医疗专家、行业专家、数学专家、精算专家、法律专家一系列的,这些专家才能真正帮到员工。
比如在很多场景要提供法律专家,有些问题不是简单看条款就能够回答的,必须得结合保险保障范围、合同法和其他民法相关的内容才能够真正回答。
在行业方面,每个领域都有非常复杂的问题,例如在财产险方面,对于煤矿员工的意外保险方面,缺乏很多的经验数据,就要能够针对煤矿场景里的各种风险问题进行勘测,哪些方向要进行勘测,勘测结果如何影响产品定价,这需要大量的行业专家经验。
但现状是一方面缺少行业专家,另一方面行业专家的经验传承度不够,很难积累形成系统化的服务能力。我们如何打造专家能力呢?一般分成几个步骤:
一要清晰对专家能力进行定义,确定专家都需要具备哪些能力;
二是对能力进行细致化拆分,很多能力是由子能力构成的;
三是针对每个能力构建语料数据,大模型需要通过特定数据在基础模型进行二次训练,构建对应的专业训练语料数据非常关键;
四是基于基础模型语料数据进行微调以及强化学习;
五是基于训练结果使用之后,要能够形成闭环反馈流程不断迭代,整个大模型应用构建是不断迭代、不断提升的过程。
数据或者准备训练数据是非常重要的,如何去构建这些专家,都来源于数据。大模型与传统的大数据其实所需要的数据内容存在差异,传统的大数据所需要的,往往是客户数据、经营数据以及IT系统产生的数据。而大模型训练的数据是知识、方法、经验,沉淀这些数据,大模型才可以成为专家。
我们自己也做了相关的实践去试验如何沉淀能力专家训练需要的相关数据,让大模型系统学习了140多本包括精算、资管、财务方面的保险行业书籍,基于专业领域知识提炼形成了20万条问答对,帮助大模型掌握运用知识解决问题的能力。
同时我们建立了考试题库验证大模型的学习效果,经过在基础模型基础上二次训练后,不论知识覆盖度还是解答问题的准确率对比二次训练前都有了大幅提升。当然我们还在不断优化过程中,可能离预期还有距离,但这个方向是值得探索的。
数字劳动力还有另外一个特点是要实现服务闭环,让大模型具备环境感知力、规划决策能力,同时能够采取行动。
举例来说,根据A保险公司最近十年的保费规则数据,预计下一年的保费额以及绘制保费额的走势。我们需要构建大模型的多模态感知能力,大模型要能从数据源获取数据并能正确解析和理解数据,数据来源可能是结构化表格或者从网页抓取信息,再就是通过API调用系统读取信息。第二是规划和决策能力,大模型天然具备这项能力,但需要通过二次训练使其更符合我们的预期,所谓规划就是将任务拆解成执行步骤,包括读取表格中对应列,利用回归模型来进行预测,以及绘制折线图。在执行时要通过生成代码的能力,以及调用合适的API来完成整个操作,这就是完整的服务闭环的实现路径。
03
真正实现数字劳动力等大模型落地的挑战及应对机制
在私有化环境去部署使用行业开源大模型,参数规模相对较小,能力受限,但要真正实现数字劳动力落地的愿景挑战非常大,首先需要足够的算力资源支持,其次需要强大的基座模型支持,而且基座模型要通过不断演进提升能力。
此外,我们也看到国内的大模型和OpenAI最新的GPT-4 Turbo版本对比的情况,仍有较大差距。在技术方面,用超级大的公有模型解决保险金融机构的问题不太现实,所以还是要私有化部署,同时用一定规模的基础模型加上多个领域小模型的方案更容易落地,因为领域小模型解决特定问题的性价比更高。在岗位场景方面,我们需要构建领域知识和数据、建立大模型可交互的数字工作环境以及制定可实施的场景方案,让大模型真正应用在场景里。
更长远来看,如果要落地数字劳动力,岗位和场景都要重构,在可行性方面会面临诸多挑战;
一、技术方面首先要进一步提升解决问题和完成任务的准确性。
二、要解决业务可行性的问题,场景应用能否成功,需要业务部门深度参与并愿意接受变革,只有愿意接受改变,才能形成合作基础。
三、成本要求也是需要考虑的重要因素,现在大模型的研发成本和算力成本高昂,低价值场景不太适用。
四、泛化能力如何满足长尾需求,数据准备不够充分的情况下能否发挥价值。
五、更重要是业务输出的安全可控,也是影响大模型实际应用的技术性问题。
六、大模型的巨大投入未来何时能否产生期望的价值仍然存在不确定性,如何控制好战略投入的节奏也是一个很重要的问题。
为了解决这样的挑战,我们形成了联合实验室创新机制,跟行业技术厂商,包括算力厂商、大模型厂商充分合作,实现资源互补、贡献共担和成果共享的模式,一起解决核心问题,通过试点场景阶段性验证大模型带来的效果,再决定下一阶段的投入,共同探索大模型在保险行业中的应用。
12月21日,2023慧保天下数智保险专题研讨会在深圳正式拉开帷幕,主题为“做好数字金融大文章,加快数智保险发展”。在上午举行的主题演讲环节,中国太保集团数智研究院院长王磊发表了题为《保险大模型应用的探索思考》的主题演讲。
在演讲中,王磊指出,过去数字化赋能的主要方向在于传统的数字化技术,尤其是大数据+人工智能的技术在探索保险领域的创新应用。而通过大模型可以带来两个改变:一是通过大模型技术和传统数字化技术的结合,能够提升人员服务能力,具备更多复合型专家能力;二是可以大幅提升人员效率,能够提供更多等效劳动力。
他表示,相比数字技术,大模型技术是“人”的模型,具备理解、思考和解决问题能力,可以通过训练解决通用领域和专业领域的不特定问题,并可以操作完成相关任务,形成闭环服务。大模型技术为保险行业带来了包括更合理的成本结构、更优的客户体验在内的机会。大模型技术能够建设数字专家能力,打造领域专家能力,建设具备感知、规划、执行链路能力的数字劳动力。
面对大模型落地可能会面临的诸多挑战,他也分享了应对机制,即要与技术企业形成联合创新合作的机制,实现资源互补、贡献共担和成果共享,共同探索大模型在保险行业中的应用。
以下即为王磊演讲全文:
王磊 中国太保集团数智研究院院长
太保的数据研究院,主要面向云计算、大数据、人工智能、物联网、区块链等技术,定位也是如何用这些新技术创新性应用在保险领域里,为主业赋能。我们是技术团队,今天的分享更加聚焦在技术领域,所以我分享的题目是《保险大模型应用的探索思考》。
01
大模型:理性思考可闭环服务、部分替代人工降低成本
在过去的两年,数字化赋能的主要方向在于传统的数字化技术,尤其是大数据+人工智能的技术在探索保险领域的创新应用。
无论是大数据还是传统人工智能技术都存在着赋能的天花板,在保险领域面临的较大难题是虽然数据多,但数据实效性差、质量不高、维度少,以及保险领域全流程线上化程度和自动化程度不高,因此大数据应用周期长,也需要依赖于大量的外部数据,效果体现较缓慢。
在人工智能的领域里,会遇到什么问题呢?大量的人工智能用在识别,图像识别,OCR还有决策模型和预测模型用的是比较多的,但是真正遇到智能交互的场景,包括NLP技术在内的传统AI效果并不理想。
大模型跟传统的数字技术相比,具备更多的新能力,包括它的思考模式,原来无论在决策模型还是识别等方面,都是比较直接简单的判断。而大模型可以具备更理性、有推导能力的思考模式,可以通过规划能力、编写代码帮助完成行动,形成服务闭环。
此外,从模型训练的角度来讲,传统模型训练都是单个场景和任务,需要准备大量的语料。而大模型具备更强的泛化能力和通用性,可以基于较少的样本数据训练更多的场景。相比之下,原来只能做某个环节的智能,大模型出现之后,可能可以实现对于某个工作流程、工作岗位的建模,让大模型部分替代非创造类脑力劳动,降低人工成本。
这件事带来的改变对于保险行业来说,实际影响会非常大,原因有两方面:
一方面,保险行业是劳动密集型的产业,产品情况复杂多样,在服务客户、销售产品的过程中都需要投入大量人力来完成非标准化,不能纯粹靠用户自助来完成流程,需要巨大成本。同时对于员工的高要求,客户体验存在巨大偏差,从整个保险业成本结构也能看到,有效赔付给用户占比只有55%左右,理想占比应该更高,甚至到达90%,我们应该降低在渠道营销、管理运营包括应对欺诈方面的成本。在当下整个市场面临挑战的情况下,我们更应该坚持数字化智能的方向,有效优化成本结构。
另一方面,未来的市场趋势是体验经济,客户更追求个性化、专业化服务以及能够及时响应的服务,客户对服务体验的要求愈来愈高,通过传统的模式很难满足,这也是数字化赋能的方向。
02
太保大模型数字劳动力的两大特点及其具体应用探索
如果真正要去解决这些问题,通过大模型可以带来两个改变:一是通过大模型技术和传统数字化技术的结合,能够提升人员服务能力水平,具备更多复合型专家能力;二是可以大幅提升人员效率,能够提供更多等效劳动力。
具体来看,太保大模型的战略方向要打造保险领域的数字劳动力,具有两个特点:
第一是要具备一定的专业深度。所谓专业深度是指具备一定的学习壁垒,不是通过短期能马上掌握的能力,往往通过多年的专业培训才能得到的能力;从能力模式来看,不是通过简单的问答搜索能解决,而要通过对于知识理解掌握和推理能够解答问题;基于这种专业能力要能够辅助员工来完成他原来不能完成的专业性工作。具备这样的专业深度,就能够增强员工能力,让他成为复合型的超级员工。
第二是要形成服务闭环,不只是解答,要能够完成完整服务,要具备收集信息、理解思考推理和规划、行动能力,可以提供更多的等效劳动力,能够帮助员工完成大量重复性的工作。
复合型专家能力在保险场景无处不在,在整个场景我们需要各种各样的专家,包括像保险产品专家、医疗专家、行业专家、数学专家、精算专家、法律专家一系列的,这些专家才能真正帮到员工。
比如在很多场景要提供法律专家,有些问题不是简单看条款就能够回答的,必须得结合保险保障范围、合同法和其他民法相关的内容才能够真正回答。
在行业方面,每个领域都有非常复杂的问题,例如在财产险方面,对于煤矿员工的意外保险方面,缺乏很多的经验数据,就要能够针对煤矿场景里的各种风险问题进行勘测,哪些方向要进行勘测,勘测结果如何影响产品定价,这需要大量的行业专家经验。
但现状是一方面缺少行业专家,另一方面行业专家的经验传承度不够,很难积累形成系统化的服务能力。我们如何打造专家能力呢?一般分成几个步骤:
一要清晰对专家能力进行定义,确定专家都需要具备哪些能力;
二是对能力进行细致化拆分,很多能力是由子能力构成的;
三是针对每个能力构建语料数据,大模型需要通过特定数据在基础模型进行二次训练,构建对应的专业训练语料数据非常关键;
四是基于基础模型语料数据进行微调以及强化学习;
五是基于训练结果使用之后,要能够形成闭环反馈流程不断迭代,整个大模型应用构建是不断迭代、不断提升的过程。
数据或者准备训练数据是非常重要的,如何去构建这些专家,都来源于数据。大模型与传统的大数据其实所需要的数据内容存在差异,传统的大数据所需要的,往往是客户数据、经营数据以及IT系统产生的数据。而大模型训练的数据是知识、方法、经验,沉淀这些数据,大模型才可以成为专家。
我们自己也做了相关的实践去试验如何沉淀能力专家训练需要的相关数据,让大模型系统学习了140多本包括精算、资管、财务方面的保险行业书籍,基于专业领域知识提炼形成了20万条问答对,帮助大模型掌握运用知识解决问题的能力。
同时我们建立了考试题库验证大模型的学习效果,经过在基础模型基础上二次训练后,不论知识覆盖度还是解答问题的准确率对比二次训练前都有了大幅提升。当然我们还在不断优化过程中,可能离预期还有距离,但这个方向是值得探索的。
数字劳动力还有另外一个特点是要实现服务闭环,让大模型具备环境感知力、规划决策能力,同时能够采取行动。
举例来说,根据A保险公司最近十年的保费规则数据,预计下一年的保费额以及绘制保费额的走势。我们需要构建大模型的多模态感知能力,大模型要能从数据源获取数据并能正确解析和理解数据,数据来源可能是结构化表格或者从网页抓取信息,再就是通过API调用系统读取信息。第二是规划和决策能力,大模型天然具备这项能力,但需要通过二次训练使其更符合我们的预期,所谓规划就是将任务拆解成执行步骤,包括读取表格中对应列,利用回归模型来进行预测,以及绘制折线图。在执行时要通过生成代码的能力,以及调用合适的API来完成整个操作,这就是完整的服务闭环的实现路径。
03
真正实现数字劳动力等大模型落地的挑战及应对机制
在私有化环境去部署使用行业开源大模型,参数规模相对较小,能力受限,但要真正实现数字劳动力落地的愿景挑战非常大,首先需要足够的算力资源支持,其次需要强大的基座模型支持,而且基座模型要通过不断演进提升能力。
此外,我们也看到国内的大模型和OpenAI最新的GPT-4 Turbo版本对比的情况,仍有较大差距。在技术方面,用超级大的公有模型解决保险金融机构的问题不太现实,所以还是要私有化部署,同时用一定规模的基础模型加上多个领域小模型的方案更容易落地,因为领域小模型解决特定问题的性价比更高。在岗位场景方面,我们需要构建领域知识和数据、建立大模型可交互的数字工作环境以及制定可实施的场景方案,让大模型真正应用在场景里。
更长远来看,如果要落地数字劳动力,岗位和场景都要重构,在可行性方面会面临诸多挑战;
一、技术方面首先要进一步提升解决问题和完成任务的准确性。
二、要解决业务可行性的问题,场景应用能否成功,需要业务部门深度参与并愿意接受变革,只有愿意接受改变,才能形成合作基础。
三、成本要求也是需要考虑的重要因素,现在大模型的研发成本和算力成本高昂,低价值场景不太适用。
四、泛化能力如何满足长尾需求,数据准备不够充分的情况下能否发挥价值。
五、更重要是业务输出的安全可控,也是影响大模型实际应用的技术性问题。
六、大模型的巨大投入未来何时能否产生期望的价值仍然存在不确定性,如何控制好战略投入的节奏也是一个很重要的问题。
为了解决这样的挑战,我们形成了联合实验室创新机制,跟行业技术厂商,包括算力厂商、大模型厂商充分合作,实现资源互补、贡献共担和成果共享的模式,一起解决核心问题,通过试点场景阶段性验证大模型带来的效果,再决定下一阶段的投入,共同探索大模型在保险行业中的应用。
热门资讯
关注慧保天下