基于主题模型的专家检索研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:flnlucifer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前专家检索的方式无法分析文本中的语义结构信息。通过作者主题模型挖掘文档中的作者与词项的关系,建立了文档、作者、主题和词项的关系,打破了文档模型专家与查询独立的假设。基于作者主题模型的专家检索根据聚类结果,采用三元数组表示新文档中的每一个单词,根据专家与文档的关联关系,为每个候选专家建立支持文档,在支持文档上计算专家与单词的共现关系以及作者与文档的关联关系,根据专家与查询的相关度高低返回专家列表,采用JS距离法发现与某专家相似的专家群体。从ACL和EMNLP_CONLL会议上选择1557篇论文组成实验数据集,通过基于作者主题模型的专家检索与文档模型方法在查准率、召回率、MAP值和检索耗时方面的对比,发现基于作者主题模型的专家检索能够有效提高专家检索的性能。
其他文献
随着信贷业务的快速发展和变化,随着信用联社贷款业务的不断发展和服务提升,对信贷管理的处理效率提出了更高的要求,为了更为规范和有效地管理信贷业务,同时,加快信贷企业的
如今互联网的互联互通的网络大量信息爆炸的时代里,数据库海量的数据给我们提供了很多有价值的信息,而我们如何通过现有技术将这些数据利用起来,是我们面临的一个亟待解决的
伴随着我国经济社会发展和事业单位分类改革工作的推进,全国地勘行业迎来了事转企的改革高潮。X省地矿集团作为地勘单位改革的一面旗帜,在地勘单位体制改革中走在了全国前列。但其原有的人力资源管理体制陈旧、效能不高,在体制改革过程中对人力资源管理变革的重视程度不够,绩效管理问题重重,已经不能适应转企后单位改革发展的需要。如对绩效管理缺乏认知、考核指标设置不合理以及员工参与度低等,尤其是在目前地勘行业进入衰退
随着云存储和大数据等技术的迅猛发展,各行各业越来越多的数据都存储在云端。而存储在云端的海量数据中,有大量的数据是重复数据,这就造成了宝贵的存储空间的浪费。为了减少
NFSR(非奇异反馈移位寄存器)是一类广泛应用于通信和密码算法中的寄存器。圈结构是用来刻画NFSR状态图的一种常用的表述方式,即该NFSR可以生成多少个圈以及每个圈的圈长是多
研发费用加计扣除政策普遍被认为是一项能引导企业加大研发投入的税收激励政策,然而各项研究表明政策的实施效果有待继续提高。企业执行政策所发生的成本被认为是政策失效的
钦州白话是广西粤语方言的代表之一,含有丰富的量词。而量词研究作为词汇研究的一个热点,不仅能帮助观察词类的语义功能,还有助于从中探索句法功能及量词本身的演变与发展。从笔者收集到的文献来看,钦州白话方言的量词研究甚少,缺乏系统的描写和研究。因此,对钦州白话的量词展开系统性的研究具有重要的学术参考价值。有鉴于此,论文拟通过田野调查来记录钦州白话的量词及相关语料,运用语义学、句法学和类型学等相关理论和方法
当前,随着全球一体化进程的不断加深,市场竞争环境日益激烈,金融产品及服务同质化严重,加上第三方移动支付快速普及以及互联网金融的创新冲击,我国商业银行均积极谋求变革转
随着个人消费需求的智能化,位置信息日益彰显其重要性,安全的位置验证必不可少。目前,针对位置密码学的研究已经取得了大量的成果,但是,如何以区域为凭证信息,设计基于区域的
校企合作,对高职院校来说有着重大的现实意义,影响着高职院校办学的质量和前途。高校的管理工作也属于公共管理的范畴。无论发达国家还是发展中国家,都将校企合作摆在了职业