书签分享收藏举报版权申诉 / 5

立即下载加入VIP,免费下载

当前位置：首页 > 考试认证 > 财会金融考试 > 大数据背景下的寿险产品定价与创新.pdf

大数据背景下的寿险产品定价与创新.pdf

文档编号：3176911
上传时间：2022-11-19
格式：PDF
页数：5
大小：1.71MB

《大数据背景下的寿险产品定价与创新.pdf》由会员分享，可在线阅读，更多相关《大数据背景下的寿险产品定价与创新.pdf（5页珍藏版）》请在冰豆网上搜索。

大数据背景下的寿险产品定价与创新.pdf

保险天地HAINANFINANCEMonthly襊摘要：

本文基于实际数据对于保险业大数据现状进行了统计分析，给出了保险业数据量现状以及数据使用效率的统计结果；同时以实际大数据量为基础，对传统的寿险产品定价进行了改进，获得了更优的市场比较优势；最后以大数据量为基础，打破传统寿险产品的思维定势，开发出新型的保险产品并对产品风险进行了精确测定。

关键词：

大数据；数据挖掘；精算定价；保险创新中图分类号：

F842文献标识码：

A文章编号:

10039031（2014）01005305DOI:

10.3969/j.issn.1003-9031.2014.01.10基金项目：

教育部重点项目（11JJD790004）和中国人保灾害研究基金资助，中央财经大学青年创新团队支持。

收稿日期：

20131015作者简介：

张宁（1978-），男，辽宁朝阳人，理学博士，中央财经大学副教授、硕士生导师；郭楠（1993-），女，山西大同人，中央财经大学保险学院学生。

大数据背景下的寿险产品定价与创新研究大数据又称为巨量数据、巨量信息和海量数据，指的是所涉及的信息量非常巨大，以至于传统的软件和技术无法进行有效的信息获取1。

大数据技术就是在这种海量数据下有效的数据分析技术，即能够在各种各样类型的数据中，快速获取有价值信息的能力2-3。

保险因自身的业务特点与大数据关系更加密切，它天然就有大数据的特征，这是因为：

第一，保险业是经营风险的行业。

它的产品本质就要求对标的物风险进行精确测定。

而如何测定这些风险，一方面是金融模型或数理技术，另外一方面就是数据信息，两者结合，缺一不可。

海量数据为保险公司测定风险提供了“天然”的机会；对于保险公司来说，大数据技术实际上就是如何利用公司的海量数据来厘定风险。

第二，保险公司的利润来源于收取的保费和未来的赔付支出的差额，这其中的赔付支出即是保险公司的风险，该风险与标的物的未来风险密不可分。

所以保险公司实际上是对这些风险发生的概率进行预测，这和大数据的本质不谋而合大数据的一个关键核心就是预测4。

第三，保险经营的每个过程都和大数据密不可分。

保险公司经营过程中涉及到产品定价、核保核赔、产品销售、投资、风险管控等，每一步都在不断利用数据，同时也在不断产生数据。

实际上，从信息量来看保险业，大数据时代早已经提前到来。

随着信息技术的发展，保险公司每时每刻都要积累着大量的数据信息，数据量的级别呈现爆炸式的增长。

同时，保险行业的大数据技术还刚刚起步，保险公司还没有充分而主动的利用大数据提供的优势。

一、保险业大数据现状介绍在大数据现状调查中，笔者统计117家保险公司，占大陆全部保险公司的97%以上，基本上可以代表保险业的整体情况。

其中，58家人身险公司和59家财产险公司。

在人身险公司当中外资公司23家，中资公司35家；在财产险公司当中中资公司38家，外资公司21家。

统计的结果是数据量。

保险公司里，数据量主要包括以下几方面：

张宁1；郭楠2（1.中央财经大学中国精算研究院，北京100081；2.中央财经大学保险学院，北京100081）532014年第1期总第302期一是保单数据及保单维持数据，这部分数据基本上都在业务系统中；二是核赔理赔数据，这部分数据随着电子化，大部分也在业务系统中，同时部门内部也有对应的数据库；三是投资理财数据，因为寿险经营时间长，保费投资是寿险经营的重要方面，所以这部分数据在寿险公司中体现最为明显，导致大量的金融市场数据集中在投资部门，这部分数据通常和业务系统是分离的；四是定价数据，这部分数据是精算部门用来定价和利润测试，以及用来向保监会报送各类报表运算时候需要的，有相当一部分来自于业务系统；五是风险管理数据，这部分数据相当零散，且涉及到以上各类数据，同时还包括公司的财务乃至宏观管理数据。

我们在统计中也把行业公共数据以及监管数据放在这里面统计。

对每家公司进行全部数据的估算后加和，结果扣除公共数据（及金融市场数据以及公共行业数据和监管数据）就得到中国保险业整体的数据量情况（见图1）。

从图1可知，中国保险业的数据量呈井喷式增长，这也说明了大数据是目前保险业必须面对的考验。

同时对个体公司进行了详细分析，来考察普通一家保险公司在生产经营过程中需要面对的数据量是多大（见图2）。

从2图可知，对于普通保险公司来说，其面临的数据量和整个行业的数据量没有本质的区别，这也充分说明保险业的深化改革已经有一定成效，保险公司的充分竞争已经得到很好的体现。

在这样海量数据信息的背景下，保险公司在定价、营销、经营以及风险管理方面都必须引入大数据技术来获得相对于行业的比较优势。

笔者对保险业20082012年的数据使用效率进行了统计和分析。

这是一个很复杂的问题，这里主要给出在产品定价方面的结果。

大数据的特点是容量大Vol-ume、速度快Velocity和资料多样性Variety5。

我们的评价也是从这个角度来进行的，需要说明的是，在统计过程中，限于公司保密等原因，结果仅仅包含25家寿险公司和23家财产险公司。

但结果总体上也反映了在定价方面，保险业大数据技术的发展程度（见图3）。

图3反映了目前保险公司在定价方面的数据效率，基本上近5年没有特别大的变化，并没有充分挖掘大数据的潜力，在大数据技术上还有很长的路要走。

正是基于这种现状，笔者尝试从大数据背景出发，以寿险定价为例来说明大数据技术的初步应用。

二、寿险产品精算定价的“再精算”寿险产品定价是基于寿险精算模型进行纯保费（精算现值）的计算，然后使用“资产份额”和“宏观定价法”来确定实际保费。

在这个过程中，涉及到的数据量实际上仅包括传统的生命表（保监会规定）以及部分抽样数据，这部分数据仅占可利用数据的5%左右。

笔者考虑在保险公司持续经营下，新开发的一种保险产品，它在在传统数据依赖上可能只需要一些精算部门的经验数据，以及传统的已经做好的模型，只需要修改一些基本假设和预订费率，预订利率以及预订死亡率即可。

在大数据背景下，与此保险产品有关的数据范围扩资料来源：

笔者根据中国人口与就业统计年鉴（20032009），样本保险公司理赔库和中国20002003生命表相关资料整理得出。

图2普通保险公司所面临的数据量图120052012年中国保险业数据量统计资料来源：

笔者根据中国人口与就业统计年鉴（20032009），样本保险公司理赔库和中国20002003生命表相关资料整理得出。

图3保险公司数据效率资料来源：

笔者根据中国人口与就业统计年鉴（20032009），样本保险公司理赔库和中国20002003生命表相关资料整理得出。

财产险公司效率（%）人身险公司效率（%）6000500040003000200010000200520062007200820092010财产险公司（单位：

G）人身险公司（单位：

G）20112012200520062007200820092010财产险公司（单位：

G）人身险公司（单位：

G）2011201230002500200015001000500018200820092010201120121614121086420542014年第1期总第302期保险天地HAINANFINANCEMonthly襋表3大数据背景下的定价与传统定价净保费比较（30岁）保险期限30岁（大数据）30岁（传统）10.18680.253920.31920.370330.44530.481240.56540.586850.67970.687460.74540.748170.78540.787480.80890.811790.82190.8261100.82880.8340110.83200.8380120.83340.8398130.83400.8405140.83420.8408150.83420.8409160.83420.8409170.83420.8409180.83420.8409190.83420.8409200.83420.8409展到了整个业务部门乃至核保核赔部门，这些部门的数据经过多年的积累能够进行有效连接，形成一个庞大的后台数据记录，我们以某一家普通保险公司为例，该数据连接后形成了一个900M的数据记录池，这些客户的记录无疑能够对传统定价有很大的帮助，能够在精算定价的结果进行“再精算”过程。

寿险产品中最重要的就是死亡率，在传统定价方法中，使用的是20002003年生命表，该生命表已经使用多年，反映了当时的死亡状况。

对于一款推向市场的寿险产品，它所面临的人群实际上是未来的客户，他们的死亡率状况与20002003生命表已经有很大差异。

利用大数据平台，我们可以构造庞大的分年龄和分时间死亡率表，在处理之后得到如表1所示。

19832011年数据是一个面板数据，用他们可以很好表明公司客户面临的死亡率状况。

为了进行定价，我们使用Lee-Carter模型进行数据信息获取。

Lee-Carter模型是由美国人口学家LEE和CARTER于1992年共同提出的，该模型的具体形式如下：

lnmxt=ax+bxkt+xt

（1）其中，mxt表示x岁的群体在t时刻的死亡率；ax表示年龄因素对发病率变化所起的解释作用，是依赖于年龄的参数；kt表示时间因素对发病率变化所起的解释作用，为依赖于时间的参数；bx则反映了年龄因素对于kt的敏感程度，xt是随机误差项。

为了确使估计参数时所得估计值唯一，通常会对模型参数做出如下假定：

tkt=0，xbx=1。

用该模型可以提取其死亡率信息，并对死亡率进行有效预测，该预测是通过的预测完成的，如表2所示。

在kt基础上可以重组未来不同年龄的死亡率，然后利用定价模型计算净保费：

P=Qn-1m=0m|qx*vm+1=Qv*qx+Qv2*pxqx+1+Qvn*n-1pxqx+n-1+

（2）其中，P为保单趸交净保费，Q为保险金额，n为保险期险且n20，i为市场利率。

以30岁死亡给付为例，计算结果和传统定价方法如表3所示。

表2预测后的kt表1大数据整合实例，分年龄分年代历史数据统计年份年龄20092008200720062005200420030-40.691.251.332.521.560.461.65-90.180.170.160.320.1910-140.150.20.540.215-190.180.320.190.150.0620-240.090.080.130.20.530.225-290.110.080.100.220.260.290.4730-340.350.470.120.500.350.40.4935-390.260.460.320.690.620.640.8140-440.760.570.520.880.840.871.2245-490.940.410.731.381.471.891.6150-541.381.672.671.072.53.231.7655-591.972.973.122.873.953.984.7660-644.534.737.293.926.838.195.4365-698.388.918.078.3011.5610.6314.3670-7413.0317.7714.6216.1119.2714.8422.9275-7927.7527.9128.5919.4635.1538.0738.2780-8441.4349.4348.4548.1759.7154.3371.8585-8962.3562.5986.5966.67103.9586.63122.6390-94165.44113.82139.30103.35177.16226.57252.695-99269.87100+360.64总计3.313.172.753.643.574.09注：

截取的是20032009年，实际表格是从1995年开始，加上国家统计数据，实际上是从1983年开始。

资料来源：

笔者根据中国人口与就业统计年鉴（20032009）；样本保险公司理赔库、以及中国20002003生命表相关资料整理得出。

年代kt20040.637531720050.6550199420060.727285420070.7410257200