保险条款文本结构化系统设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:jxx168jxx168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,自然语言处理技术的不断发展使得文本结构化系统在不同知识领域得到了广泛应用。诸如医疗、新闻等领域的文本结构化研究已经取得了较大突破,而在保险领域尚未出现较成熟的文本结构化系统。由于专业知识的不同以及文本内容描述形式的不同,目前还不具备一个通用的文本结构化系统满足各个领域信息抽取的需求。保险文本独特的语言风格,使得面向保险领域的文本结构化系统研究仍存在着新的挑战。保险条款是保险购买人以及保险公司双方确立的有关权利与义务的条文,其核心内容保障责任描述了保险公司承担的责任范围,以及被保险人发生保险事故时保险公司应负的赔偿责任。将该非结构化的文本进行结构化处理有助于实现用户对保障责任内容的快速阅读以及有效理解。本文提出了面向保险领域的保险条款文本结构化方法,并以此作为支撑构建了保险条款文本结构化原型系统,模拟提出的算法在实际的保障责任条件查询过程中系统的应用场景。本文主要内容包括以下几个部分:(1)通过网络爬虫采集各个保险公司的保险条款原始PDF文件,并针对不同文本格式的PDF文件设计不同的文件解析策略以获取保险条款中保障责任文本内容;(2)本文提出了应用于非结构化的保障责任文本数据的结构化方案,即通过保障责任长文本语义分割、保障责任短文本分类、保障责任实体信息抽取以及短文本结构化结果融合的多阶段文本处理方法,最终实现人寿险、意外险、重大疾病险、理财险和医疗险五大类中包含的共98524条保障责任文本的结构化;(3)基于所提的方法,设计并实现保险条款文本结构化系统。测试结果表明,本文所提出的多阶段文本处理方法有效的实现了保险条款中文本的结构化,达到了系统预期设计的要求。
其他文献
分析南昌县已组建的农民用水户协会创建和运行规律,了解农民用水户协会在农田水利供给上的优势与不足,保证协会更健康的发展,减少推广时期的不利因素。
福利制度与国民的日常生活息息相关,是人生中不可忽略的重要一环,对于国民来说,福利制度可以作为其最后的生活依靠。因此,对于国家来说,福利制度也起着收缩贫富差距的重要功能,是社会公平不可缺少的最后底线。自20世纪90年代以来,对于福利制度的研究又开始一波热潮,起点是丹麦学者艾斯平·安德森发布的《福利资本主义的三个世界》,安德森从去商品化的角度进行了划分,但是很多国家并不完全符合安德森的体系,并且出现了
本文以淡紫拟青霉TD16液态发酵所产红色素为研究对象,研究了表面活性剂对生物量和色素产量的影响,色素的分离纯化方法及结构的初步鉴定、色素的染色性能及抑菌性能。主要研究
处于海洋环境中的混凝土结构其耐久性问题十分重要,特别是因荷载、氯离子、硫酸根离子等物理、化学作用造成的混凝土内部钢筋锈蚀与表层损伤,在整个海工混凝土结构耐久性中尤
鸡腿菇又名鸡腿蘑,学名叫毛头鬼伞,是新兴的食用菌品种,在山东省栽培时间为春三月、秋八至九月为宜.栽培方式多种多样,现介绍床栽技术。
高校实验室是教学、科研、培养创造型人才的重要基地。文章通过对目前高校实验室管理体制、实验设备、实验经费、实验队伍等方面存在的问题进行剖析,从而提出加强实验室建设
玉米果穗是由茎秆中上部叶腋的腋芽分化而成。玉米的果穗数与品种的特性及栽培条件有关。栽培条件好,茎秆上有1~2个或更多的腋芽发育成果穗,若栽培条件不好,影响果穗分化和籽
黄瓜幼苗对水、肥、气、温、光反应敏感,极易产生病苗、弱苗、伤苗和劣苗。怎样视苗情,找原因,综合天气土壤等诸多因素进行管理,以获得适龄壮苗,是日光温室生产的重要问题。以下是
在新的世纪,随着中国的改革与发展步入全新的发展阶段,党和国家的发展理论与发展战略创新也取得了重大突破。从全面建设小康社会战略目标的确定。到科学发展观的树立,再到构建社
用自然居群取样和单位点同工酶遗传标记的方法对小慈姑(Sagitariapotamogetifolia)湖南茶陵居群中两个亚居群的异交率作了研究.密度较低的亚居群Ⅰ与密度较高的亚居群Ⅱ的异交率估计值分别为t—∧Ⅰ=(81.9±