基于多类信息融合的判决预测

来源 :山东大学 | 被引量 : 0次 | 上传用户:zxj3510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于机器学习和深度学习的传统方法能够在罪名预测、法条预测上取得较好的准确率,但是对于样本数量比较少的类别准确率较低,其主要原因是样本不均衡,导致模型学习过程中偏向于样本数量比较多的数据类别,造成样本数量比较少的样本类别得不到有效地训练。由于其复杂性、地域性等外界因素的影响,现有模型大都存在刑期预测准确率不高的问题,无法达到可以应用的水平。单一的犯罪事实描述作为输入无法提供足够的信息支撑,必须寻求额外的知识,才能进一步提高刑期预测的效果。犯罪事实描述文本过长,极易出现长距离依赖问题,直接造成网络提取信息的能力下降,不能有效地编码文本中的有效信息。针对上述问题,本文提出一种基于多类信息融合的判决预测模型,通过在单一犯罪事实描述输入的基础上添加基于事实认定的结构化数据,提高模型预测效果。实验结果证明,论文提出的基于多类信息融合的判决预测模型具有较高的准确率、较好的鲁棒性以及各类别均衡学习的能力,在判决预测任务上取得了较好的成果。论文的主要贡献及创新点如下:(1)针对样本不均衡的问题,本论文提出结构化数据与犯罪事实描述相结合的方法。从裁判文书中提取出基于事实认定的结构化数据,并将结构化数据的信息与文本信息进行融合。实验结果证明,结构化数据与犯罪事实描述相结合的方法能够有效地提高小样本数据的准确率。(2)针对结构化数据嵌入困难的问题,本论文将结构化数据分为连续数据和离散数据,分别设计了连续数据编码器和离散数据编码器,并且与文本信息相融合。实验结果证明,本论文设计的连续数据编码器和离散数据编码器能够有效地编码基于事实认定的结构化数据。(3)针对犯罪事实描述文本过长的问题,本论文设计了 Transformer-HAN结构,提高文本编码能力。由于犯罪事实描述文本较长,直接使用RNN类编码器会造成长距离依赖问题,所以,论文摒弃传统RNN文本编码器,改用HAN层级编码器,HAN基础部件采用Transformer结构,进一步提高模型编码能力。(4)为了探索多任务结构是否适合本任务,以及什么样的任务结构能够达到最优效果,本文设计了多类对比模型,在分类器结构上探索最优模型。实验表明,多任务模型比单任务学习具有更强的鲁棒性,本文提出的基于拓扑结构的多任务结构优于普通多任务结构,在f1,MP,MR等指标上具有更好的结果。
其他文献
从社交网络中抽取不同性质的子集是社交网络领域中一项重要的研究内容。在已有工作中,该研究课题大致分为两种:基于用户属性特征进行抽取;或基于网络拓扑结构特征进行抽取。但是,从单一角度抽取的子集往往不足以代表原集,因为在抽取的过程中只保留了部分特征。针对该问题,本文提出了新的解决方案。在抽取子集的过程中综合考虑了用户属性特征及拓扑结构特征,以确保抽取结果与原始数据集尽可能相似。具体工作如下:(1)本文针
尘埃等离子体在宇宙空间和实验室中广泛存在,从上个世纪末开始研究者们就开始对尘埃等离子体进行研究。尘埃等离子体的前沿研究课题有很多,其中研究者们对非线性波的研究一直
如今,数据聚类是许多领域的基本问题,例如机器学习,模式识别,计算机视觉,数据压缩等,而图像聚类作为图像领域中的一项关键技术,有着很重要的研究价值和应用前景。随着人工智
四足机器人凭借着优秀的环境适应能力,在崎岖路面和复杂环境作业中占据了无可比拟的优势,近年来已然成为移动机器人领域的前沿研究方向。SLAM为代表的环境感知技术,能够赋予
当前,心血管疾病已成为我国乃至全世界的重大公共卫生问题。展开对心血管疾病辅助诊断的相关研究,对提高国民生活质量,实现国家卫生与健康计划具有重要意义。目前,在心血管疾
胡峄阳文化是以青岛地区历史名人胡峄阳为文化符号、具有鲜明区域特色的传统乡村文化。中国传统乡村文化往往自发产生于乡民的生活实践和愿望,以某一历史名人和历史事件为基
骨关节炎是在老年人群中的高发的一种骨关节疾病,主要表现为关节软骨的破坏继发关节内炎症。临床上骨关节炎的早期多表现为弥漫的、大小不一的软骨浅表缺损。早期的病人在日常活动或者运动中关节受到创伤,会造成软骨撕裂、软骨块的剥脱,形成全层损伤和小块浅层损伤或者弥漫性大小深浅不一的浅层损伤。由于软骨组织的自我的修复能力有限,尤其是浅层部分的软骨的独特结构和生理病理特点,导致其更加难以修复。同时,由于现有治疗手
随着化石能源的日渐枯竭,以及全球变暖日益加剧,氢能作为零碳能源正在脱颖而出,在众多产氢方法中,电解水产氢凭借绿色环保的巨大优势,备受人们的关注;同时,将大气中的CO2经过
花是植物与传粉者交流的载体,花大小的变化通常能引起传粉者的访问偏好差异。在雌雄异株的植物中,雄花通常大于雌花,这种花大小的差异与性别功能密切相关,但不同雄花的花大小
脂肪酸层状结构以脂肪酸双分子层为基本单元构筑而成,包括平面双分子层、囊泡、碟状胶束、层状液晶(LLC)等,其中LLC及平面双分子层结构与细胞膜骨架磷脂双分子层结构类似而具有