基于聚集模型的企业专家检索系统研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:jinjiajie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息量的骤增,如何在一个企业或组织范围内有效地管理知识、组织信息,从而提高企业管理者的领导能力和员工的工作效率,成为越来越迫切的需求。这使得企业信息检索获得越来越多的关注。专家搜索是企业信息检索中的一个重要研究课题。对于一个大型的企业组织来说,能够自动地找出组织内部某一领域内的专家是十分有用的,例如咨询相关问题、组建研究小组等等。本文针对当前已有的企业专家检索模型进行研究和改进,提出了一种新型的、基于聚集模型的专家检索系统,旨在解决现有专家检索模型存在的查询准确率偏低的问题。具体地,本文的主要工作主要体现在以下几个方面:第一,本文介绍了目前应用最广泛的企业专家搜索模型:文档模型和候选者模型,并对两者的优缺点进行了系统的比较和详细地分析;第二,本文提出将聚集模型作为企业专家搜索的解决方案。与现有的文档模型和候选者模型不同,聚集模型对候选者进行建模时不再局限于一类能够证明其技能的相关信息,而是通过从企业知识库中识别、提取出多种相关信息,例如,员工的技能简历,与员工相关的所有文档,以及具有相同技能的相似专家等等,从而对员工的知识和技能进行建模。然后,这些候选者与给定检索词之间相关的概率就由员工的聚集模型推出这个检索词的概率决定。在估算概率时,我们采用了信息检索中得到广泛使用的语言模型。第三,在聚集模型的框架下,基于文档模型和候选者模型,提出两种方法分别对这两种模型进行了改进:针对文档模型,提出一种基于加权的文档-候选者联系加以改进;针对候选者模型,提出一种基于滑动窗口和IDF过滤的方法加以改进。然后,这对两种改进的模型开展了相关实验进行评价。最后,本文首次将相似专家(拥有相似技能的候选者)引入了专家检索,通过发掘候选者之间存在的联系,以此来提升专家检索系统的查询准确度。相应地,本文对相似专家的引入对专家检索系统的影响也开展了实验进行分析和评价。本文通过使用TREC提供的数据集和测试平台,对聚集模型的有效性进行了测试与评价。实验结果表明:本文所提出的基于聚集模型的专家检索系统能够有效地对候选者的知识和技能进行建模,从而提供比现有专家检索系统更好的性能。
其他文献
语文教材是以文本形式构成的教学内容的载体.它以特定的结构方式呈现教材编者对“教什么”与“学什么”的构想与设计.这种构想与设计既需要依据,又需要立足文本特点,所以对教
2型糖尿病(T2DM)认知功能障碍以记忆力下降为主要表现,是T2DM脑损伤的一种表现形式.目前通过神经影像学检查已可直接探测出T2DM患者脑损伤:脑部磁共振平扫发现T2DM患者记忆障
在新的课程体系下如何进行选修课的教学,一系列严峻的问题摆在高中语文教师的面前:选修课如何突破高考瓶颈实现真正意义上的选修?教师如何转变观念、改善自身素质并调整教学
本文结合曹庄煤矿的突水资料,重点探讨了矿山压力作用对回采工作面底板突水的影响 Combined with the water inrush data of Caozhuang Coal Mine, this paper focuses on th
长期以来,感应测井作为一种重要的测井方法,其基本理论是建立在均匀无限大地层假设基础上,线圈系的轴线与井轴是平行或重合的,所以只能探测出地层水平方向的一维电阻率,这就很容易
协作通信与网络编码技术作为近年来通信界的研究热点,它们对于提高通信系统的容量,通信效率等方面的性能都有着各自突出的贡献。前者是基于中继通信理论发展而来,它将传统的中继
目前在图像监控领域,基于PC和Internet的有线图像监控系统应用较为广泛,但其体积大、功耗高、成本高、布线繁琐、对监控现场要求高等缺点一定程度上制约了它的进一步发展和应用
戏剧是一种综合舞台艺术,它以表演艺术为中心并集合了文学、音乐、舞蹈等其他艺术门类,通过演员表演故事来反映社会生活中的各种冲突,完成预想的叙事目标.
一、高中语文课程标准中的口语交际rn2003年(即通常所说的新课标,本文参考的是2007年5月第八次印刷版)中,多处提到口语交际,近年来学界也多有文章提到口语交际教学的重要性,
庞培,江苏江阴籍的诗人与散文家.笔者认为从审美价值看,比之诗人,作为散文家的庞培更令人感佩.其散文著作有等.这篇散文选自,借此可以管窥庞培文字绘画超凡的敏感和才情.