语义指纹相关论文
为准确识别意见领袖的敏感舆论倾向,有效把控敏感类舆情的发展,提出基于多任务学习的敏感舆论倾向识别模型(MTL-SA-LSTM)和基于指......
抄袭他人的研究成果,篡改或伪造数据后继续发表,给学术研究带来了极严重的危害。因此,建立一种快速准确的论文抄袭检测模型,是具有现实......
词作为语言的基础,具有相对的稳定性。但是语言是不断往前发展的,作为语言的一种成分,词又具备着语言的发展变化性。随着互联网的......
随着互联网的快速发展,网络媒体应运而生,传统媒体公司也随之建立了新闻发布网站。网络传播的快捷性、互动性、开放性等特点使得民......
由于微博、微信和门户网站等均是公开传播媒介,所以极易导致新闻内容被抄袭、篡改或非法扩散,继而给新闻内容原创者造成经济损失。......
互联网、物联网、云计算等信息技术把我们带到了多元智能的网络化大数据时代。然而,大量的资源共享和实时的交流探讨使网络空间中......
英文专利发明人姓名歧义现象越来越严重,极大阻碍了英文专利数据的研究应用.为了解英文专利发明人重名辨识方法的研究现状,进行了......
相似检测算法在海量文本信息处理中具有广泛的应用,尤其是Simhash算法因其指纹局部敏感特性、检测效率高在文本查重、网页检测等大......
针对中文文本,抽取出文本内容特征,结合Simhash算法生成中文文本的语义指纹,通过语义指纹的海明距离判断文本间相似程度。整合Sing......
文本相似检测算法在海量自然语言文本信息处理中具有广泛的应用,包括常见的科技论文查重、大规模网页去重、科技论文自动摘要等。......
互联网上大量存在的因转载而重复的网页,使得搜索引擎必须发现并且去除这些重复网页,来节省解析、索引等后续处理的时间和存储、检......
为将稀疏分布式表征理论应用到著者姓名消歧,了解其在解决姓名消歧问题时的效果,提出了基于稀疏分布式表征的英文文献著者姓名消歧......