【摘 要】
:
根据现有的类案推荐方法得到的相似案件,其精确度通常很难满足法官的需求,辅助判案效果有限.为此,提出了一个基于上下文感知的类案匹配和推荐模型(CASCMR).模型为实现端到端高效率的文本匹配与推荐,使用多语义文档表达框架,并通过文本向量预先计算与存储,减少匹配时间,进而提高效率.具体而言,为了更好地对法律长文本进行建模,CASCMR使用BERT对数据进行编码,利用其注意力机制捕获文本长距离依赖信息.同时,考虑法律文本从局部到全局的信息,利用双向LSTM和CNN分别获取文本的上下文信息和局部语义特征,提高法律
【机 构】
:
深圳大学大数据系统计算技术国家工程实验室,广东深圳518060;深圳大学人工智能与数字经济广东省实验室(深圳),广东深圳518060;深圳大学计算机与软件学院,广东深圳518060
论文部分内容阅读
根据现有的类案推荐方法得到的相似案件,其精确度通常很难满足法官的需求,辅助判案效果有限.为此,提出了一个基于上下文感知的类案匹配和推荐模型(CASCMR).模型为实现端到端高效率的文本匹配与推荐,使用多语义文档表达框架,并通过文本向量预先计算与存储,减少匹配时间,进而提高效率.具体而言,为了更好地对法律长文本进行建模,CASCMR使用BERT对数据进行编码,利用其注意力机制捕获文本长距离依赖信息.同时,考虑法律文本从局部到全局的信息,利用双向LSTM和CNN分别获取文本的上下文信息和局部语义特征,提高法律文本的表征能力,从而提升模型的预测性能.将所提出的模型应用到中国法研杯2019相似案件匹配任务,实验结果显示,与目前最好的方法相比,匹配和推荐精度的提升效果较为明显.
其他文献
本文以电能计量自动化中通信技术的应用与提升措施为研究课题,先讨论当前电力行业中对于通信技术的应用现状,然后分类讨论电能计量自动化中应用的通信技术类型,之后分析电能计量自动化中通信技术的具体应用,以电能计量信息采集业务为例具体讨论通信技术的应用方式.最后,阐述电能计量自动化中通信技术应用提升措施,期望能够加深电力行业与通信技术的融合,提高电力行业供电服务质量.
采用分步合成法制备合成了用于催化碳酰肼去除给水中DO的甘氨酸席夫碱Cu配合物催化剂,考察了反应温度、pH值、催化剂质量浓度和碳酰肼投加量对催化除氧性能的影响,并确定了反应的最佳条件.在反应温度为45℃、碳酰肼投加量为理论量的2倍、溶液初始pH值为8、催化剂质量浓度为0.01 g/L时,在反应5 min后,DO的去除率便可以达到94.8%.同时通过元素分析、红外光谱、紫外光谱表征对催化剂的结构进行分析表征,Cu与甘氨酸席夫碱配体成功配合,且-C=N-、-COO-、Ar-O-参与了和Cu的配位.该配合物在常低
在信息技术快速发展的时代,数据已成为重要的生产要素,大数据上升为国家战略.本期本栏目专门刊发了由中国计算机学会CCF主办,CCF大数据专家委员会和中山大学联合承办的第九次全国大数据学术会议推荐的5篇优秀论文,内容涵盖了电力数据挖掘,智慧司法,医学图像分类,推荐系统,实体关系抽取等各方面的内容.反映了当前大数据在各行业的广泛应用,相关成果将为研究人员带来启发.
本文首先对电气设备革新的必要性进行阐述,然后对嵌入式远程监控系统在电气设备中的应用价值和功能进行分析,并进行硬件电路介绍,最后提出设计策略.该设计具备远程监控的功能,可以保证机电设备在使用过程中的有效性和电气自动化控制系统的科学性.
新型冠状病毒(COVID-19)感染者胸部X射线(Chest X-ray,CXR)图像不同于正常人,是诊断的有效依据.在ResNeXt模型基础上,加入交叉堆叠的通道注意力模块和残差注意力模块以及提出的维度降解模块,提出了针对COVID-19 CXR图像分类的COVID-SERA-NeXt模型.对公开访问的基准数据集COVIDx进行图像分类,实验结果显示,提出的COVID-SERA-NeXt模型在多项指标上优于其基础模型ResNeXt,其中准确率、宏召回率分别提高到96.11%、95.46%.经过Chest
针对现有方法中缺乏实体之间潜在的隐性关系挖掘和头实体信息提取不够充分的问题,提出了一种头实体增强的多跳注意力隐性关系联合挖掘模型Multi-Air(multi-hop attention implicit relations joint mining method).该方法首先使用 BERT(bidirectional encoder representa-tions from transformers)模型对输入句子进行特征编码并通过Sigmoid函数预测出头实体的位置,然后通过双向门控循环单元(bid
针对国内外在220 V和380 V供电电压的低压地区电力消耗的研究较少,很难探究实时线损的问题.对供电、用电、线损、窃电4个方面进行数据分析,建立统计模型与聚类模型,探索电力消费和窃电的规律.利用时间序列分析、频谱分析、概率密度函数、互补累积分布函数的统计模型进行分析.结果表明窃电用户用电周期是正常用户的2倍,窃电用户的日均用电量大于正常用户,窃电用户在台区线损率大于40%时数量激增,线损率到达65%时数量放缓,可以优先排查此区间的台区.基于时间序列相似度度量和k-means聚类相结合的聚类模型,将566
随着教育信息化的深入发展,以传统的云计算技术、大数据技术等为基础的智慧校园在升级建设中存在网络带宽不足、时延过大和算力不足等瓶颈问题,基于5G边缘云计算的网络架构为解决此类问题提供了一种可行的解决思路.本文在对5G MEC 3种主要架构研究基础之上,提出了教育信息化2.0时代智慧校园虚拟5G MEC建设部署方案,有助于推进智慧校园的重新构建.
本文提出了一种“互联网+医疗健康”服务模式下的智慧产房系统,阐述了智慧医疗、母婴服务、资源管理等系统功能,总结了系统的创新点和应用前景,并从人文角度和医护角度分析了智慧产房系统的社会效益.
随着社会发展,物联网技术逐渐兴起,成为现阶段引领社会潮流的技术之一.海量数据的出现给物联网数据处理增加了难度.基于此,本文对物联网环境下的数据库技术从技术特点和数据检索两方面进行研究,并对物联网环境下的数据库的应用技术进行了阐述,希望能为物联网更好地发展提供一定的帮助.