基于选举模型的专家检索的研究与实现

被引量 : 1次 | 上传用户:fh2029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业信息化的不断发展,专家检索任务日益受到信息检索研究组织的重视。Feldman和Sherman等人的调查报告中特别强调了在企业中信息获取的重要性。因此,员工能够有效的获取到重要的信息便成为了企业提高竞争力的关键。传统的搜索引擎已难以满足此类企业用户的专业需求,继而文本检索会议提出了专家检索任务,该任务完全不同于传统的信息检索任务,检索目标不再是文档列表而是一个专家列表。所谓的专家列表是指一个有序候选人名单,排序的依据是候选专家对查询主题相关专业技能的掌握程度。本文通过分析对比现有的专家检索方法,采用选举模型(Voting Model)作为基本模型进行改进。基本选举模型中,将专家的检索问题视为一个选举问题。每个候选专家建立一个描述文档集,通过查询Q得到相关文档集R(Q),在R(Q)中的每篇文档作为对该文档描述的候选专家的一次投票。本文在此基础上,将专家对文档的贡献度进行定量分析,将其作为文档证据对专家的投票的可信度。专家对文档的贡献度的度量基于专家在文档中出现的特征信息的形式,频率,以及文档的质量等因素。本文对专家的排名不仅依靠专家自身的描述文档对其的投票评估其与查询领域的专业相关性,还结合了与其关联的其他候选专家的专业水平。如果在候选者的社会关系网中存在查询主题领域的专家,那么该候选者也可能是该领域的专家。并且,在与其关联的候选者中存在的专家越多,越权威,则该候选专家就越可能是该领域的专家。在社会关系网中,两候选者的关系可以体现在两者在文档中的共现或者两者的描述文档之间的链接引用关系。实验表明,本文提出的改进选举模型(Dev-Voting Model),较原选举模型(Voting Model)在查准率上有显著的提高,引入专家排名算法Expert Rank后,改进效果更加明显,从而说明本文提出的改进模型和排名算法在专家检索中是合理且有效的。
其他文献
税收是以国家为主体,为实现其职能,凭借政治权力,按照法律规定,强制、无偿取得财政收入的一种特定分配形式。随着经济的发展,对税收收入进行预测显得越来越重要,它决定着税收
广东省是我国的经济大省,同时还是制造业大省,而机械制造业作为制造业的重要组成部分在其中占有极大的比重。工业建筑设计一般都在工艺设计的基础上进行,并趋向科学化、精细化、
随着人类基因组计划的完成,生命科学研究进入了后基因组时代,即蛋白质组学的研究。蛋白质组学中有两条技术路线:一条是基于肽段的"bottom-up",另一条是基于蛋白质水平的"top-d
发展中国家的金融发展问题是发展经济学研究的主要内容。金融抑制论、金融约束论和金融自由化理论是研究发展中国家金融发展问题的经典文献,代表当代金融发展理论研究的方向,成
输电线巡检可以发现线路中存在的安全隐患,避免重大电力事故的发生,对电力系统的正常运行起着重要作用。直升机巡检输电线是国家智能电网的重要组成部分,可以降低传统人工巡
高校舞蹈教学是一种与实际接轨较为密切的学习活动。学生在教学中的适应性状况如何,对学生在学习中能取得多大的成效具有重要的影响。从某个角度上来说,学生在舞蹈教学中的适
线性调频(LFM或Chirp)信号有良好的时频分辨力,容易获得较高的脉冲压缩比,可以提高雷达的威力范围,是现代雷达中普遍使用的一种信号。本论文以数字射频存储(DRFM)干扰技术为
脉冲多普勒雷达具有波束窄、动作快、精度高等优点,同时具有多普勒速度识别和过滤功能,抗杂波干扰能力强,因此空空导弹雷达导引头普遍采用脉冲多普勒雷达末制导。箔条作为传统的
本文主要研究了基于特征的车辆及车牌的检测与跟踪。对车辆特征的检测与提取主要是利用背景差分的方法来完成,其中背景通过高斯模型进行建立和更新,然后通过连通域标定的方法
本文以Speber和Wilson的关联理论为基础,研究小品中的刻意曲解现象,刻意曲解是日常生活中一个常用的语言交流策略,在我们所熟知的中国小品中也有广泛的应用。如果听话者已经明白