传统银行的转型实战看工商银行如何利用大数据洞察客户心声Word格式文档下载.docx
- 文档编号:16132539
- 上传时间:2022-11-20
- 格式:DOCX
- 页数:8
- 大小:23.56KB
传统银行的转型实战看工商银行如何利用大数据洞察客户心声Word格式文档下载.docx
《传统银行的转型实战看工商银行如何利用大数据洞察客户心声Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《传统银行的转型实战看工商银行如何利用大数据洞察客户心声Word格式文档下载.docx(8页珍藏版)》请在冰豆网上搜索。
作者:
张佶
编者按:
中国工商银行采用了中科鼎富的发明专利产品DINFO-OEC非结构化大数据分析挖掘平台实现行内的非结构化大数据领域的应用创新。
这个案例就是众多创新应用中的一个生动实例!
主讲人:
工商银行技术经理
大家下午好!
非常荣幸能在这里给大家做一些交流和分享。
让我们开始吧!
工商银行文本挖掘技术应用探索分享
工商银行在大家传统的印象当中是一个体形非常庞大但是稳步前行的形象,但是近些年来在大数据的挑战下工商银行积极应对外界变化,做一些转型。
其中一个举措就是通过数据应用驱动业务变革。
今天我所分享的主题就是和银行的客户服务相关的,如何应用文本挖掘技术洞察客户的心声。
工商银行每天都在面临着来自各方的海量的客户心声,最近我们的95588接到这样一个来电,李先生做了一笔跨行汇款操作,对方还没有收到,他来询问什么时候可以到帐,这是一个典型的咨询。
客户王先生是一个贵宾客户,他来电反映说在机场和火车站没有享受到工行提供的贵宾厅,他希望工行在以上场所做明显提示。
还有张小姐到一个支行网点做存款业务,发现里面柜员服务态度不耐烦,让她很不满意,她要求把这个情况记录下来做一个反映,这是一个典型的投诉。
除了官方服务渠道之外,现在客户越来越希望通过互联网社交网络的方式表达他们的心声,并探讨热点话题。
最近我们监测到这样一个热点话题的讨论,有人说“大家看清楚了,针孔摄像头就是这样装进ATM机偷看你的密码的。
”这是一个风险事件,工商银行需要做到及时了解和掌握。
同时在互联网的新闻网站上最近也有一些报道,有的市民在便利店蹭WiFi,上了两个小时网,他的银行卡就被盗刷了,这个又是怎么办到的,工商银行需要对这些事件做到了解掌控,并且制定对应的措施。
以上这些信息都是以文本方式存在的,我们可以通过文本挖掘的方法了解用户在说什么,挖掘出对我们有价值的信息,这对工商银行客户服务的提升会有很大的帮助。
传统客户服务分析流程
首先我们了解一下传统银行客户服务的分析流程。
当我们的客户拨打95588热线电话之后,客服座席会把他说的话和要求记录下来,存到客户之声系统之中,系统会对结构化的部分进行分析,比如投诉的数量、客户对我们满意度的打分或问题处理时效。
对于其中非结构化数据的部分,就是客户说了什么当时没办法做自动分析,这只能由分析人员逐个来看,但毕竟数量比较多,人工阅读做不到非常全面,只能做抽查,大概看看客户在说什么。
我们监测分析人员同时还会去登录一些新闻网站了解一下近期有没有跟工行相关的事情发生,然后他会把这个情况记录下来,人工编写这么一个服务的报告。
当时对我们的社交媒体是没有办法做到关注的。
结合文本挖掘的客户服务分析流程
在结合了文本挖掘技术之后有了一些流程变化,不仅对结构化数据做分析,同时也能够从客户反馈的文本当中提取出客户的热点意见,再把热点去和结构化数据做关联分析,就能得到更加丰富的分析场景,这在后面会有一个详细的介绍。
同时,我们又新建了一套互联网的监测分析系统,能够对互联网上的金融网站和社交媒体网站做到自动的监控和分析,当然有些重要的事情发生的时候可以自动的形成监测报告。
从刚才服务流程的演变可以看到有了一些挖掘的功能,首先从技术来说丰富了分析的手段,原来只能对结构化进行分析,现在能够对文本数据客户所说的内容进行分析,然后扩大了分析的范围,原来只能关注到工商银行官方服务渠道所记录下来的信息,现在能够关注到在互联网上所传播的信息。
第三点是提升了分析的效率,原来需要员工逐条阅读工单,现在机器自动阅读。
客户意见挖掘业务价值
这些技术提升点之后就能在打响的文本反馈当中发现客户的热点意见集中在哪些方面,如果我们能够对这些客户所反映的共性问题主动发起一些措施,优化我们的业务流程,可以提升我们的客户满意度和客户忠诚度,而另一方面这些来电的投诉量会进一步的减少,也就从另一方面降低我们的服务成本,减少了二次被动的服务投入。
案例分析
今天想分享两个具体的案例,一个是对95588客户服务的一些工单如何做到客户意见挖掘,这个是从无到有的设计和探索的全过程;
第二个案例当中会介绍一下如何聆听在互联网上传播的客户的心声。
客户意见发掘——业务目标
通过95588服务热线记录大量的客户反馈的文本,拿到一堆文本之后怎么切入客户的意见挖掘呢?
最重要的是先对客户做分类,结合业务的处理流程设计这么一套适用于银行客户意见的分类体系,当有投诉过来的时候就知道他所说的是关于自助服务的还是银行卡、还是关于网点服务的。
这样我们就能分析各个类别里不同的发展趋势并且进行有效处理。
但有了意见分类还不够,我们知道哪一类的意见是最多的,我们尝试性做热词分析,文本由大量的词汇构成的,我们想看一下在这么多的客户反馈文本当中大家提到哪些词汇,从中提取客户说的最多的、最频繁使用的词汇,用可视化的方式生成一个词语。
从这个图上我们就能看到有一些效果,包括像工作人员、机具、查询、词汇等等凸显出来。
在这个图上所反应的信息不够精准,我们只知道有一些关于工作人员的评价或描述,但是不知道工作人员到底出现什么问题,我们的自助机具到底是故障比较多还是客户不会用。
同时这个图当中还存在多词疑义的问题,工作人员和柜员两个词说的是类似的问题,这对我们造成干扰。
如何精准概括客户意见?
我们提出统一的、概括的用户观点的表达方式,就是对象、属性、评价三元组的形式。
下面这个例子有四句话:
柜员说话口气非常差。
今天在柜台办业务,里面的人态度很差;
柜员脾气不好,柜员语气很不耐烦。
用我们的属性评价方式概括就是“柜员态度不好”。
有了这样的方式之后对刚才的词云做分析,发现刚才的词云已经演变成了意见云,这些意见都是指向非常明确的比较精准的,比如说网银跨行汇款不成功,短信余额变动不能接收,网点效率低,网点排队时间过长,相信大家对这些问题也并不陌生,在有了这个图之后我们的分析师就能够比较直观的了解最需要去改进的问题,客户的意见都聚集在哪些方面。
客户意见挖掘——模型建立
有了刚才的这些设计方式之后,我们可以怎么样选择最贴合我们业务场景的分析方法,刚才我们首先提到了需要对文本做自动分类,我们最容易想到的就是朴素贝叶斯,它可以计算一篇文章属于哪个类别的概率最大,可以完成分类。
但是进行实际分析和尝试的过程当中发现这样一个典型的算法,在我们的实际业务场景上其实并不是特别的适用,首先我们缺少训练数据,因为我们这一套意见类别的分类体系是新建的,历史上并没有积累好数据,如果我们重新去标注呢,这些意见类别又特别多,有的类别层次又比较深,所以很难在比较短的时间内完成高质量的标注。
其次,朴素贝叶斯假设的就是文本当中的词汇与词汇之间是相互独立的,跟我们的业务也不相符合,比如之前提到的“态度不好”这两个词基本是会关联出现的,不会单独分开出现,如果单独统计也就失去了意义。
所以我们发现当我们的业务描述语言和业务描述逻辑非常复杂的时候,统计的准确度都不会太高。
刚才又提到需要自动提取对象属性评价用户观点,一开始用户的观点是在讨论一个个话题,是不是可以用基于LDA这样的模型完成话题的提取呢?
我们也做一些尝试,最后发现像LDA提取出来的话题有时候过粗,不适合我们的具体业务,比如我们想要的是“柜员态度不好”,最后只能精确到柜员描述的层面,作为一个非精度的模型比较难以调优,有某几个话题质量不是太高甚至存在重复话题的时候,没有办法做针对性的调优,最重要的一点还是它的可警示性比较差,分析出一些主题之后没有办法把话题归纳成我们所需要的对象属性的评价形式。
既然我们尝试过一些典型的传统方法不太适用的时候,接下来怎么办?
我们选择了本体模型,从具体的实际业务出发建立这样一套适用于业务的一套本体体系,首先介绍一下本体是什么概念?
本体最早是一个哲学概念,在哲学层面指的是现实世界中事物的具体存在,比如我手上拿的话筒具体的事物存在就是本体,比如我们还可以称它话筒或麦克风,甚至可以拿一张话筒的图片来描述它。
把本体概念引申到信息科学的语义层面就变成知识科学体系。
首先我们用本体表示多层次的业务分类或具体的业务目标,本体业务可以由要素和概念两个不同的层面构成,要素是业务层次,一般描述业务对象或业务属性,这跟我们的专业领域相关,需要专家来维护,在银行领域就需要维护像“信用卡”和“借记卡”这样的业务要素。
概念是语言层次,描述基础的语言概念,比如说我们对时间怎么描述、对地点怎么描述,包括人的情绪或者人对事物的评价等等,这些语言概念由于基础的资源,它跟专业的业务领域是不相关的,这就可以由我们的技术人员协助业务专家做一些收集和积累,比如说常见的一些语言概念,比如对于“不及时”怎么说,对于“异常”有哪些说法。
在我们的设计当中把业务层次和语言层次进行了相互分离,这样的事情就有两方面的好处,我们的业务专家就可以专注在业务要素的维护上,而不需要再去关注语言上的表达细节。
另外,这些语言概念有些是不相关的,就有比较高的附庸性。
本体模型的示例和难点
具体模型示例,我们建立的银行客户建立本体体系,跟刚才提到的客户分类体系是完全一致的,这里面有一个本体叫“工作人员”,它又可以和对象要素和属性要素进行关联,对象要素包括柜员、保安、保洁、大堂经理,属性要素包括态度、业务熟练度,本体和要素又同时可以从第三个层次“概念”里相互关联,概念像好、快、热情、熟练、故障。
通过对象要素、属性要素和评价概念这三者进行相互连接和组合就能够构成我们对工作人员这个本体挖掘表达式的设置,从中得到我们想要的三因素,比如像柜员态度好、大堂经理业务熟练,同时我们只要知道这个观点是在描述柜员或者保安,能够把这样一个情况给分类到工作人员这个类别下。
刚才介绍到这里的时候大家会感受到一个本体模型明显的问题和难点,这些本体还是依赖于人工梳理,人工很难,我们采用的是基于深度学习的本体半自动构建方式,其中一个方式就是对文本当中邻近词汇做剪辑,我们具体使用的是Google开源的Word2Vec词向量模型。
这些词向量具有一个特点,它的纬度是固定的,避免了传统空间向量模型当中维数灾难的问题。
由于我们已经用词汇向量表示一个词汇的含义,向量之间又是可以加起来的,所以我们在大量文本的背后可以分析出潜在的语言学的规律,最典型的例子是国王-皇后等于男人-女人。
在实际运用中是不是有比较好的表现呢?
我们做了一些尝试,最后有一些定律定义词汇之间语义的相关性。
从这个例子当中看到效果还是不错,对ATM这个语义最相近的词汇有ATM机、取款机、自动取款机、柜员机、自助机。
还有“好”这个词语义最相近的比如温柔、利索、忙前忙后、谦虚、和蔼可亲。
可以看到Word2Vec是有一个比较好的表现。
进一步看一下Word2Vec能不能帮助我们的业务要素找到最靠谱的平台概念。
做一个尝试,有三个比较常用的业务对象,包括短信、柜员和保险,设置了一组评价概念的词汇,通过Word2Vec找到了这些概念和评价词汇之间的相似度,标红的部分是明显高于其它的连接方式的。
能够看到短信连接到漏发、错发、诈骗,柜员可以连接到怠慢、欺骗、误导,保险可以连接到欺骗、诈骗和误导,这确实能够有效帮助我们辅助人工做梳理,缩短整个模型构建的周期。
客户意见挖掘——实施效果
既然有了客户意见表示方式,接下来应用于什么业务场景当中。
首先把客户个体意见和客户星级数据做关联,这样就能看到不同星级之间的客户关心的不同问题在哪里,其中我们看到像七星级客户和三星级客户关注的问题有非常大的差异,其中还有五星级客户甚至
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 传统 银行 转型 实战 工商银行 如何 利用 数据 洞察 客户 心声