基于文本挖掘的商业银行客户投诉分类模型应用研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:wpaghq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
银行是经营货币信贷业务的重要金融机构,它的存在促进了社会资金的融资与融通,极大方便了人们的生活。随着金融行业日益膨胀,各大金融机构竞争越来越激烈,衡量金融机构的重要指标之一是运营服务的质量,金融消费者对金融机构业务服务质量也有了更高的要求,当达不到消费者的要求就会发生投诉行为。如何快速且高效地处理银行等金融机构的客户投诉,提高金融机构业务服务质量,降低消费者不满意程度,成为目前银行等金融机构领域管理人员及学者最为关注的事情。银行等金融机构的客户投诉一般以文本的形式储存,并且数目巨大,若仅仅依靠人工处理,费时费力效率低,因需要采用自然语言处理方法,本文通过主题建模、自动分类模型、情感分析等方法实现银行等金融机构投诉文本的分析,围绕银行投诉与文本挖掘的相关概念与理论、我国银行客户投诉的数据背景、银行等金融机构客户投诉的投诉内容等方面展开研究与分析,为相关金融机构有效处理客户投诉,提升业务服务质量提供参考价值。主要研究内容及结论如下:(1)梳理了2018年12月—2020年12月银行等金融机构客户投诉的文本内容,共4723条,揭示了目前银行等金融机构的投诉现状:投诉量大、投诉类别多、相关部门处理时间滞后等,这意味着金融机构处理客户投诉的难度大,对责任归属部门提出了更高的要求,为了减少客户投诉量、提升金融机构口碑名誉,必须寻求有效方法。(2)构建了专业领域的分词词典与停用词词典,进行了投诉文本分词、去除停用词等预处理,统计了银行等金融机构客户投诉分词结果的词频,实现了投诉文本可视化分析,通过词云图可知银行等金融机构客户投诉最多的是业务办理、信用卡、征信、贷款、客服态度及处理问题效率等方面;计算了相应词语的TF-IDF值,TFIDF值表示了某个词在文档中的重要程度,根据词向量结果对客户投诉进行特征提取,将每一条客户投诉看做一个文档,构建了文档—词条矩阵,测算了每个词语在每个文档中的影响力;计算了不同词条间的欧氏距离,采用了层次聚类Ward法大致观测客户投诉所集中的类别。(3)构建了银行等金融机构客户投诉的LDA(Latent Dirichlet Allocation)主题模型。针对主题数目k值不确定的问题,引入了主题困惑度指标,根据主题困惑度与银行等金融机构的实际业务类别进行主题数的确定;结合第三章基于TF-IDF值构建的文档—词条矩阵,采用吉布斯抽样算法构建主题模型,生成文档—主题矩阵与主题—词条矩阵,对矩阵结果进行可视化分析,最终根据银行投诉文本析出16种主题类型,为按类处理客户投诉提供决策依据。(4)构建了银行等金融机构投诉文本自动分类器。按照7:3的比例把客户投诉文本数据划分为训练集与测试集,原投诉文本定义为预测集。采用朴素贝叶斯分类算法、KNN算法和随机森林集成算法对训练集进行建模训练,研究发现,三种自动分类器的准确率分别为:60.90%、70%、90.29%,随机森林自动分类器得到了较好的分类效果。基于随机森林算法的银行等金融机构客户投诉文本分类结果,构建了银行投诉领域情感词典,对不同类别的投诉文本进行了情感评分,责任相关部门按评分由低到高的顺序进行响应处置,这能有效降低客户的不满情绪。总之,本文为高效处理银行等金融机构的客户投诉文本数据作了不懈努力,所构建的投诉文本自动分类器以及其分词词库、停用词词库和情感词典等,具有较强的创新性,为辅助银行等金融机构处理客户投诉提供工具支持和对策建议,具有良好的应用价值。
其他文献
劳动教育是促进幼儿全面发展的重要手段,区域活动作为幼儿园教育的重要组织形式,同时也蕴藏着巨大的劳动教育价值,是实施幼儿园劳动教育的重要途径之一。当下在区域活动中开展劳动教育的过程中存在不足。为此,本研究立足于实践,对幼儿园区域活动中开展劳动教育的现实情况展开调查,探查其存在的问题,在分析问题产生原因的基础上,尝试提出幼儿园区域活动中开展劳动教育的有效策略。运用文献法、观察法和访谈法,以J市A幼儿园
学位
近年来,我国消费领域发生急剧变化,消费规模扩大趋势突出,消费持续提质升级,转型态势明显。未来我国经济将持续践行深化改革战略,不断扩大国内需求,持续优化和调整工业结构,以消费拉动经济,带动经济持续稳定增长。针对2020年新冠疫情强烈冲击以及变幻莫测的国际形势,促进消费提质升级,优化消费环境,既是促进当前经济社会发展的重要举措,也是贯彻落实新发展理念的必然选择。而在数字普惠金融发展过程中,其推动消费提
学位
消费是经济增长历程中不可或缺的坚实基础。而在消费中占有一席之地的是以居民消费为核心的相关指标。税制结构可以调节居民消费水平,引导居民消费规模良好发展,是刺激居民消费、提振经济的有效工具。面对如今需求收缩和预期转弱的经济形势,扩大内需的实现需要良好、健康的税制结构推进助力。因此,本文将重点研究我国税制结构对居民消费水平的影响,并深入探究税制结构与居民消费水平的非线性关系。本文首先梳理了长期以来国内外
学位
儿童作为游戏的主体,他们关于冒险性游戏的看法和态度对游戏的实践具有重要的价值。本研究通过使用照片引谈法以期探寻儿童眼中的冒险性游戏。在与天津市Y园30名儿童进行访谈的基础上,通过扎根的方法对儿童的话语进行分析,梳理儿童对冒险性游戏的态度和看法。儿童对冒险性游戏有着自己的认识和理解。研究发现:(1)儿童依据游戏内容、特点、感受、地点定义冒险性游戏;(2)儿童会从游戏结果、游戏材料、技能与能力、成人的
学位
众所周知,词汇是英语学习的基础,也是学生在英语学习过程中遇到的一个比较大的难题。正如Wilkins所说,没有语法,人类可以表达一些事情,但如果没有词汇,人类将什么都无法表达。对于初中生来说,初中阶段可谓是增大词汇量的最佳时期,然而,在科目繁多、学习压力大的初中阶段,许多学生在英语学习,尤其是英语词汇记忆方面遇到了很大挑战,这使得一些学生对于英语学习的热情消退,并逐渐对英语学习失去兴趣。因此,作为初
学位
初中正是学生由被动学习向主动、自主学习转变的重要时期,在数学学习过程中,数学资源管理策略、数学学业控制感至关重要。数学资源管理策略指的是能够帮助学生有效管理可利用的数学学习资源的策略,分为四个维度,分别是数学时间管理、数学环境管理、数学努力管理和数学学业求助管理。数学学业控制感是控制感在数学学习上的表现,用来描述学生是否相信自己有能力影响和预测数学学业成就,分为四个维度,分别是数学学业目标、数学学
学位
教育与生活相结合是新课程改革的要求之一。高中思政课教师响应新课改的号召,以立德树人作为教学的根本任务,以学生的全面发展作为教学理念,重视培养学生的学科核心素养。教师们在教学中要贯彻以生活为基础,以学科知识为支撑的教学模式。通过全面构建生活化的高中思政课教学,推动教学从生活中来、到生活中去的理念,并希望通过这样的教学方式来激起学生对思政课的学习兴趣,进而加深学生对教材内容的认识,为高中思政课教学的有
学位
大班数运算活动指的是在教师引导下,开展的一些关于大班幼儿对10以内数与数之间的组合、分解、变化及比较的理解的活动。大班幼儿的数运算能力是数学知识体系的前提基础,是数学认知能力的重要组成部分。引导幼儿学会解决日常情境中的数学问题是教师支持策略的研究重点。本研究运用观察法、访谈法、案例分析法、文献分析法等研究方法,研究对象指向大班四个班级138名幼儿及8位教师在自然状态下涉及的数运算活动。从环境支持、
学位
伴随中国经济的发展,生态环境问题也十分显著。面对当前的生态危机,为实现“美丽中国”的中国梦,急需对民众进行生态文明教育,而青少年作为祖国的接班人,理应把生态文明教育渗透到基础教育当中。以人地关系为主线的中学地理课程应成为生态文明教育的主要阵地,承担起提升学生生态文明素养的责任。论文把生态文明教育与高中地理教学相结合。在分析了国内外研究现状的基础上,从地理学与生态文明教育、高中地理教学与生态文明教育
学位
互联网技术的进步与普及增加了公众参与社会治理的渠道,信息传递和扩散的速度也更加迅猛,这意味着网络舆情的治理变得更加复杂。近年来,诸如“成都七中食品安全”事件、“江苏丙肝感染”事件、“长春长生问题疫苗”事件、“新冠肺炎疫情”事件等公共卫生事件频发,因其严重损害了公众的利益,威胁到公众的生命安全,在网络上引起了广泛的讨论,形成了网络舆情风暴。国家近年来也意识到舆情治理的重要性,明确提出要做好舆情引导工
学位