一种基于机器学习的相似度算法在文本相似度比较中的应用--以法律文本比较为例

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:jazz988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着法律文本的大量公开,在文本挖掘中发挥越来越重要的作用,同时随着机器学习与自然语言处理技术的发展,其与大数据的融合运用逐渐普及,将两者结合起来进行相似度判别分析,有利于对法律文本的充分挖掘利用,对于帮助用户了解案情,同时基于法律文本相似度分析可拓展更多应用,对于促进国家法制化建设具有重要意义。使用了一种基于机器学习的相似度算法,通过与不同词向量结合的方式,能够有效提升文本相似度对比的准确率。通过在真实民间借贷类法律文本比较案例中实验取得明显效果,准确率提升10%,具有较好的使用前景。
其他文献
水是生命之源,水是景观设计中的重要元素,水在景观设计中应用十分广泛,水具有灵活性,巧于变化。居住区的水景设计是结合居住区景观的特性,将水巧妙的融合进去,在居住区内形成
面向背景是静止的运动细胞图像序列,通过简化粒子滤波算法并在FPGA实现其硬件逻辑来设计快速跟踪系统。其是按照目标辨识和跟踪要求,用模块化思想设计采样和存储模块、权值及阀值计算模块、重采样模块和状态估计输出模块后通过硬件描述语言VHDL下载到FPGA。针对单个细胞跟踪,单个细胞分裂跟踪和多细胞跟踪的测试对该系统的快速性和准确性进行验证。实验结果表明该系统满足对移动目标快速识别和跟踪要求。
目的:探讨脑肿瘤所致大脑中浅静脉梗塞与患者认知功能障碍的相关性。方法:选取在我院就诊的60例脑肿瘤患者作为研究对象。根据这60例患者发生大脑中浅静脉梗塞的情况将其分为梗
近年来,高校网络育人工作不断发展,高校网络育人平台构建虽然初具规模但并不完善,其育人效果并未充分发挥。本文在现有研究的基础上提出构建高校“3+4+5”网络育人平台以发挥
设计了nBn结构的InAs/GaSb II类超晶格红外探测器,从理论和实验两方面对nBn器件的暗电流特性进行了研究,研究结果表明:理论计算的暗电流和实际测试结果趋势一致。另外,研制了p
本文提出一种优化有限元网洛节点标号的WGPS算法,该法是在GPS法的基础上作了一些改进而形成的。计算实例表明,WGPS法能有效地减小带宽。计算时间比GPS法大为缩短。
随着互联网规模的不断壮大,信息量正以前所未有的速度巨量增长着。在这个环境下,大数据应运而生。其法律数据呈现出数量大、速率快、多样化的特点。如何运用先进的方式对海量
作者结合工作中的实例——邵阳学院科技综合楼建筑设计,从此工程保护生态,融入环境,论述建筑与环境应是一个的和谐共生、协调统一的整体。
伴随着建筑工程的快速发展,超高层及高层的建筑物层出不穷,建筑施工安全形势不容乐观。安全生产与群众的生命健康和施工企业的生存发展有着密切联系,事关企业和谐稳定和施工