Siamese-CNN算法研究及其在法院裁判预测中的应用

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:moxihuanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
法律领域中,当事人想及时的了解有关案件的结果或者赔偿金额,需要大量学习法律的相关知识。同时,对于律师来讲,日益增加的法律文书给律师学习和总结历史案件带来困难。因此对裁判文书进行分析,可以更好的深入到法律领域,帮助律师和当事人更好的进行决策,有着重要的意义和价值。目前对于裁判文书的研究主要是基于数学统计的方法,但是数以万计的裁判文书导致统计分析的效率较为低下。在本文中,使用多核的CNN模型以故意杀人案由和继承案由为切入点,对案件的判决结果区间进行预测,从而达到为律师或者当事人提供借鉴的目的。实验结果表示,针对故意杀人案由,多核CNN的实验结果相较于传统的机器学习模型有较好的实验结果,准确率达到87.3%,但是在继承案由上实验结果仅达到52.1%。在此基础上,本文分析了故意杀人案由与继承案由样在样本集中的差异,发现继承案由的样本分布十分不均匀同时样本数量过小,根据这一特征,本文提出一种基于Siamese网络和多核CNN模型相结合的案件判决区间预测模型Siamese-CNN,并从样本组织,模型搭建,损失函数定义,性能验证等方面对该模型进行设计研究。本文最后通过实际实验对Siamese-CNN模型进行验证,实验结果证明,SiameseCNN模型在故意杀人案由中的准确率达到88.6%,在继承案由上的准确率达到79.8%。说明该算法不仅有较高的分类正确率,而且Siamese网络和多核卷积的方法提升了模型的泛化能力和预测性能。同时,本文使用标准文本分类数据集分别在Siamese-CNN模型下进行实验,实验结果表明该算法可以在样本数量较少且样本分布不均的情况下取得很好的分类效果。
其他文献
为保证大型钢结构施工质量和满足工期要求,组装和安装技术是施工中的关键问题。本文主要介绍大跨度钢管桁架的现场拼装和整体提升的施工技术措施。
网络视频行业用户数迅速增长,而电信运营商网络视频业务(主要为在线影视业务)的订购率和活跃率均未见多大改明。虽然2007年底信息产业部和广皂总局联合发布“视频网国资令”,但是
为确保数百路清晰、稳定的电视信号能够同时传送到世界各地,北京各场馆间布放了数千芯光纤,以及十多辆数字卫星新闻采集车,并且提供全部地面卫星上行资源。此外,还首次采用长距离
作为互联网新贵之一的MySpace,一直因为隐私保护和安全问题受到用户和业内人士的指责,尽管MySpace希望在网络安全上有所作为,但是,层出不穷的问题让一些用户对网站管理人员失
随着互联网的发展,人们可以方便的获取数字产品,不法分子利用数字产品容易复制和篡改的特点,非法的获得利益,这使版权人的权益受到侵害。因此,需要找到有效的方法来保护版权人的利益。数字作品中经常会有一些冗余的信息,根据冗余性的特点,数字水印技术在数字作品里加入不容易发觉的但可以判定区别的水印信息,根据提取出的水印信息确定数字作品的版权所有。数字水印技术有效的维护了原始著作人的权益,在多媒体信息安全领域逐
旅行社行业作为旅游产业的重要组成部门,其效率水平的高低是影响旅游产业整体效率和旅游经济发展的重要因素,研究旅行社行业效率的时空演化规律对发展区域旅游产业至关重要,目前已是学术界研究的热点。本文首先探讨了效率与生产率、旅行社行业效率与旅行社要素效率的概念与内涵,对国内外相关文献进行归纳总结,并采用DEA-Malmquist与层次分析法相结合的方法,构建了以旅行社行业效率评价指标体系,其中投入包含规模
湖北日报讯(通讯员徐晴、楚静)2006年3月10 日,武汉大学中国科学评价研究中心发布了一项研究成果——"世界大学科研竞争力评价"。该研究以数据表明:中国大陆科研竞争力列全
期刊
技术交易是指通过人类活动将科学技术传播的过程,随着其趋于规模化,形成交错纵横的技术交易网络。然而多数以复杂网络视角的研究只单纯停留在结构和功能两个相对独立的层面,
等离子体通常处于非平衡状态,由于粒子之间的碰撞,等离子体系统由非平衡状态逐渐趋于平衡状态,这种过程称为输运过程。输运过程是一种重要的基本过程,而确定输运系数是研究输
根据广厦重庆第一建筑(集团)有限公司四年创建三个“鲁班奖”的主要经验,本文结合重庆大学主教学楼工程“创鲁”的实际做法,阐述了创建“鲁班奖”的相关措施及方法,以供同行借鉴。