一种基于禁毒情报相似度计算的中文文本分析算法

来源 :中国人民公安大学学报:自然科学版 | 被引量 : 0次 | 上传用户:sdgxsgl123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决禁毒情报分析中缺乏对文本信息处理和利用的有效手段的问题,提供一种基于禁毒情报相似度计算的中文文本算法。结合禁毒领域的业务需求,对禁毒情报相似度进行计算分析;对统计分词方法进行改进,首先分词后进行停用词处理,然后用户可以自定义词典的同时自定义词性,最后通过正则表达式提取案发时间等信息。还手动扩充了用户词典,加入了物品库,地址库等,分词的结果有了很高的提升;用涉毒案件作为实例计算相似度,证明了本算法的可用性,符合预期的效果,这为禁毒情报线索、警情及案事件等各类线索的碰撞、多点聚焦以便及时发现有价值的涉毒
其他文献
野外调查和广泛收集资料的基础上,分析了控制和影响京张地区区域地壳稳定性的主要因素及内外动力地质的耦合作用。选取活动断裂、地震活动性和深部地球物理等因素,同时选取工
遥感数据的尺度效应决定了可识别内容与识别精度,同一区域内的遥感数据尺度不同,同样的遥感处理模型或者方法将得到不同的处理结果。以宝鸡黄土区滑坡遥感调查为基础,对不同
镇雄县安家坝一带中二叠统栖霞组一茅口组地层出露较好,沉积连续.以此剖面为基础, 连续采集碳酸盐岩样品42个,根据其显微特征、元素相关性、元素组份含量及相关元素的比值 特
在1:5万平原区填图试点项目中,以生祠堂镇幅浅表地质填图为例,研究了该区浅表三维模型的构建。根据研究区遥感地貌特征,部署了15条北西向地质路线,以Eijkelkamp槽型取样钻为手
柯坪地区发育一套沿走滑断层侵位的萨尔干基性岩脉,其产出于西南天山造山带与塔里木克拉通的接触部位,具有重要的意义。文章通过对萨尔干基性岩脉样品进行锆石LA-ICP-MS U-Pb
排水泵常采用软起动控制方式。基于微型可编程控制器的软起动控制系统实现了对水泵的起停控制、运行监视和保护功能。
本文通过分析国内外非弹性应变恢复(ASR)法地应力测量研究现状,并对ASR法中重要的柔度参数作了系统整理,认为该测量方法在理论上逐渐趋于成熟,在技术应用上有广阔的前景,但该地
桥面铺装层破损是桥梁工程常见病害之一,通过简要介绍桥面铺装层的结构组成和分析破损原因,在总结桥梁设计,使用经验基础上,寻求解决桥面铺装层破损的新技术措施,提高其使用性能。
新构造调查是研究地壳运动规律、地质灾害、环境地质和地壳稳定性评价等的基础,具有重要的理论和实际意义,是区域地质填图重点内容之一。内蒙古呼勒斯太苏木图幅1:5万填图试点
目的在文件检验鉴定实践中,如何判定朱墨时序是常常碰到的课题,本文研究如何利用显微镜的荧光检验功能对激光打印文字与印文交叉部位色料的荧光特性变化规律来判定激光打印文