基于文本分析的案件判别算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ecnuzk2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能分支下的自然语言处理技术快速发展和国务院对智慧法院的大力推行,智能司法助理已成为自然语言处理在司法领域的新应用。司法助理能够缓解当前司法领域“案多人少”现象,一定程度上辅佐法官、律师进行案件处理,缓解司法从业人员压力。让“智慧法院”的信息化建设成果能够有效的服务人民群众。目前司法领域内案件可挖掘的内容十分丰富,拥有着许多有价值的内在联系信息。使用基于词向量和深度神经网络的文本分类方法实现了统计学上的司法文书分类,但是无法实现对司法案件内在逻辑的解释。基于统计学习的方法虽然能够得到较为满意的结果,但是无法给出令人信服的解释。对于存在严谨逻辑性的司法领域,这是往往不能被接受的。本课题旨以刑事案件司法判决文书进行分析,提出并构建司法文本的语义逻辑树,并通过深度森林对事件树进行可解释性挖掘。司法文书通过对句子进行切分得到若干个子树片段,每个子树片段通过依存句法分析得到核心主谓宾三元组。通过TF-IDF算法将三元组进行权重计算,得到核心子事件序列并采用剪枝算法构建最大堆。设计的三元组编码算法实现事件树最大堆向量化,并嵌入深度森林算法实现司法文本事件树类目判别。最后自动进行司法案件的罪名自动判别和相似文书案例的推荐。基于事件树构建的模型能够将司法案件中的许多重要知识进行关联并通过计算相关知识权重自动进行判案,并把最终判案的相关知识通过可视化的方式展示。实验结果显示所提出的事件树构建方法结合深度森林算法能大大提升司法文本的逻辑解释性和准确率。
其他文献
A novel high power-density PMSM (permanent magnetic synchronous motor) with independent magnetic flux path for each phase is proposed in the paper. The complex
主题班会是在班主任老师的指导下,由班委会组织实施,全班同学参与的一种班级活动。它是围绕某一特定的主题对学生进行思想和道德品质教育的一种重要形式。主题班会具有内容丰
碳纳米管的基频对外载荷非常敏感。将碳纳米管作为微纳米应变/力传感器敏感元件时要求对基频和外载荷之间的关系进行深入的研究。在单壁碳纳米管分子结构力学模型的基础上,研究
[考点梳理]    第六课 参与政治生活  一、人民当家作主的法治国家  1.我国人民是怎样当家作主的?  (1)全国人民代表大会和地方各级人民代表大会是人民行使当家作主权力的机关。人民代表大会制度是我国的根本政治制度。  (2)全国人民代表大会是最高国家权力机关。  2.依法治国基本方略。  (1)依法治国是党领导人民治理国家的基本方略,是建设社会主义现代化国家、实现国家长治久安的重要保障。  
现场总线是用于现场仪表与控制室系统之间的一种开放、全数字化、双向通信与多站的通信系统。文中研究了CAN总线网络特性及总线构建,对CAN总线网络节点设定做了深入的研究工作
以FPGA为主控芯片,设计一款数字视频接口转换设备,完成SD-SDI(标准清晰度-串行数字接口)视频到Camera Link接口视频的转换。通过对摄像机输出的ITU-R BT.656格式数据进行采集、
EDA(Electronic Design Automation)技术已成为当前电子线路实验教学的重要辅助手段,然而利用EDA进行教学时对设备、场地、时间等资源仍存在较高的要求。本文提出一套基于云
【正】有一个美好的地方,能让你走到那里就再也不想离开……有一个安静的地方,能让你疲惫的心灵得到慰藉……那是阳朔,桂林山水甲天下,阳朔山水
Object-oriented model possesses inherent concurrency. Integration of concurrency and object-orientation is a promising new field. MPI is a message-passing stand
研究了汽油发动机外特性和部分负荷特性下的转矩曲线。对某发动机的试验数据进行整理,利用拟舍插值的方法绘制出外特性及部分负荷特性下的转矩曲线,修正了汽车驱动力图、驱动力