司法纠纷数据的语义理解及可视分析系统的设计与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:abc123student
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的发展,现有的传统司法纠纷处理系统没有办法满足时代的要求,其数据繁杂,且无法得到有效利用。以往的大量有效数据堆积,不能对未来的司法纠纷处理以及政府的决策问题产生正面影响。为了解决这一难题,本文通过技术手段将埋藏于海量数据当中的社会难点热点问题从繁杂冗余的信息中分离出来,具体分析某一时间某一地点的民众纠纷问题,以实现社会问题的深度挖掘。同时,本文运用可视分析技术,将上述数据以交互式可视图表的方式进行呈现,让市政相关工作人员可以直观迅速地从中得到有效的参考信息。为了实现上述目标,本文设计了一个基于加权TF-IDF算法实现司法纠纷文本数据分类的方法,并实现了基于该方法的一套司法纠纷数据可视分析系统。该系统旨在实现对纠纷调解记录这类司法短文本数据实现自动分类,并运用可视分析技术进行呈现,在保证数据准确性的同时帮助用户直观准确地了解到当前社会的纠纷态势,从而可以发现隐藏的社会热点问题。该系统从原始的纠纷调解数据入手,通过数据标注,模型训练,自动分类,最后进行可视化展示。本文将上述步骤分为三个部分。(1)自然语言处理。通过某市真实的纠纷数据的语料数据,经过数据清洗,中文分词,半自动文本标注,TF-IDF词权重计算,加权词权重TF-IDFc计算,模型训练等步骤,得到了纠纷语料的分类模型以及分类结果,用于后文的可视分析工作。(2)可视分析组件。基于树图、词云、迷你图等可视分析手段,针对司法纠纷数据进行了优化和整合,采用不同的规则进行多层次的树图展示,同时融合了词云和迷你图,让纠纷调解数据可以在时间和空间多个维度下进行呈现。(3)纠纷调解数据可视分析系统。将上述的分类数据、词云数据等信息用于可视分析组件,并通过B/S框架进行前后端整合,实现一套完整的可视分析系统。该系统可将纠纷调解数据以可视化图表的形式进行直观呈现,以帮助用户直观准确地捕捉社会热点问题。
其他文献
近年来,我国机动车交通事故发生数量虽然呈下降趋势,但总量依旧很大。所以在现阶段,人们非常需要可以提高车辆安全性能的辅助驾驶系统。造成交通事故的原因有很多,其中,由司
水污染问题已经成为当今社会的关注焦点。快速、准确的水污染物检测技术能够为污染物监测及治理提供强有力的依据。电化学法因其检测速度快、灵敏度高、操作简单等优点被广泛
孕激素受体(PR)表达的缺失与肿瘤高侵袭性和更差的预后密切相关。因此,构建靶向PR的分子探针并利用分子成像技术对乳腺癌的早期诊断和预后评估有着极其重要的意义。本论文中
水稻作为世界上最重要的粮食作物之一,由于其固着属性使之容易受到外界环境的影响,常常遭受一些生物和非生物胁迫。通过解析参与植物生物和非生物胁迫应答的分子机制,筛选和
21世纪以来,传统化石燃料的过度开发和燃烧造成了严重的环境问题和能源危机,因此积极探索可持续的清洁能源迫在眉睫。氢气作为无二次污染且可循环利用的新型清洁能源,成为了
水基钻井液易引起页岩水化膨胀,对于钻井过程非常不利。本文系统研究了乙烯基咪唑类离子液体的组成对其抑制性能的影响,并提出其作用机理,在此基础上研发了性能良好的聚离子
随着电子工业的发展以及电子产品的广泛使用,市场对高电容性能超级电容器的需求越来越紧迫。炭材料种类丰富、比表面积大、制备简单、价格低廉,使其可作为一种优质的电容材料
伴随着城市机动车的快速增长,城市交通拥堵问题日益严峻。为了解决交通拥堵问题,很多学者都在致力于交通控制方法的研究,提出了多种控制方法。由于交通的复杂性,对于控制结果
肿瘤转移是恶性肿瘤的特征之一,转移的发生往往是肿瘤难治和治疗失败的主要原因。肝脏是最常受各种转移性肿瘤侵袭的器官,与肝脏的组成结构和供血特性有关,而且肝内的转移瘤
锌对于维持生物的生命具有很多重要的生化功能,所以维持细胞内锌的平衡对于微生物的生长有很重要的作用,而锌应答的调控蛋白Zur(Zinc Uptake Regulator)则主要调节细胞内锌离子