面向信息精准服务的信息检索与查询推荐方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:ww447978636
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着军事信息获取手段的不断增多,军事信息总量急剧增加。日益增长的军事信息总量给军事信息系统的构建、开发、研究和维护带来了不少挑战。如何有效地组织、挖掘和分析已有的军事信息,来不断优化现有的军事信息系统,是满足军事信息系统用户的信息需求,提高军事信息利用水平,实现军事信息精准服务的关键问题。论文以实现军事信息系统的信息精准服务为目标,以数据挖掘为关键技术,以信息的准确检索以及查询的合理推荐为研究内容,围绕信息精准服务实现技术中信息检索和查询推荐所面临的理论问题和技术难点,开展了深入的研究。具体而言,在信息检索方面主要研究点包括:(1)如何结合用户在信息检索过程中的反馈信息,提高信息检索排序模型的性能;(2)如何挖掘用户在信息检索过程中行为信息,实现个性化的信息检索排序模型。在查询推荐方面主要的研究点包括:(1)如何挖掘数据信息中语义相似度来提高查询推荐的准确度;(2)如何解决在查询推荐过程中可能存在的查询推荐冗余问题。论文针对上述问题,从问题建模、算法求解、实验验证和军事应用方法等方面展开研究。主要工作和创新点如下:(1)提出了基于规则挖掘的信息检索排序模型论文在机器学习算法基础上,提出了基于规则挖掘的信息检索排序模型。该模型通过提取训练样本的主要特征进行有效聚类,并结合用户的相关反馈获取各个类中相关度判断的置信值,最终形成相似度判定模型,应用该模型来对测试样本进行相关度排序。提出的算法对LETOR数据集进行了测试,实验表明,信息检索性能指标比其他排序算法有了进一步提高,并且无需复杂的数据预处理工作和手动设定算法参数。(2)提出了基于逻辑回归的信息检索排序模型论文提出了基于逻辑回归的信息检索排序模型,采用主成分分析方法提取文档的有价值且相互独立的特征,在这些特征基础上,结合用户的相关度反馈信息,利用逻辑回归模型,生成查询与文档的相关度判断模型。我们在公开的LETOR4.0数据集上展开实验,并用MAP,P@K,NDCG@K等指标评估了各种算法的性能,验证了论文提出模型的有效性。(3)提出了基于用户行为分析的个性化信息检索排序模型论文完全关注于用户的行为信息,提出了基于用户行为分析的个性化信息检索排序模型。具体而言,我们利用用户对文档的点击信息以及用户在文档上的浏览时间,来估计查询与文档的相关度和用户对文档的感兴趣程度。在算法过程中,我们采用贝叶斯矩阵分解方法克服了数据稀疏性问题,并研究了用户和查询的分布对模型性能的影响。最后通过在实际数据集上的实验验证了用户的行为信息能用来提高信息检索性能,同时验证了用户在当前信息检索任务下的行为信息有助于识别用户的查询意图。(4)提出了基于语义相似度和时效性查询频率的查询推荐排序模型基于马尔科夫模型,论文提出了基于语义相似度和时效性查询频率的查询推荐排序模型。在该模型中,假设用户选择查询推荐符合马尔科夫模型条件,即用户通常在输入完一个完整的字后,选择某个查询推荐。同时基于在语料库上的训练结果,将查询字之间的语义相似度引入到查询推荐算法中。最后在实际查询记录数据集上的展开实验,并与传统的查询推荐方法进行比较,论文提出的基于语义相似度和时效性查询频率的查询推荐排序模型的MRR(Mean Reciprocal Rank,平均位置倒数)指标比其他算法有近4%的提高。(5)提出了基于贪婪算法的多样化查询推荐排序模型论文提出了基于贪婪算法的多样化查询推荐排序模型,该模型目的在于首先将用户感兴趣的查询尽早地返回在查询推荐列表的靠前位置,其次要降低查询推荐列表的冗余度。具体而言,在查询主题层次上,我们通过挖掘用户在当前信息检索任务下的行为信息来预测用户的查询意图。然后我们将查询推荐按照与查询意图的相似性进行排序,同时考虑了查询推荐之间的相似性,使得查询推荐尽可能地包含更多的主题。最后通过实验,验证了论文提出的基于贪婪算法的多样化查询推荐排序方法比其他算法的MRR指标和α-nDCG(α-normalized Discounted Cumulative Gain,α归一化折损累积增益)指标都有显著提高。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
目的探究索利那新与雌三醇乳膏联用对绝经后女性膀胱过度活动症(OAB)的有效性。方法选取2012年10月至2014年10月该院绝经后女性OAB患者88例,按治疗方法的不同将其分为A、B两组,
形式化验证是保证硬件系统设计正确性的一种有效的手段,它基于已建立的形式化规格,分析系统的相关特性,以评判系统是否满足期望。命题可满足问题求解是其中重要的分析推理引
视觉目标跟踪作为连接计算机视觉系统底层的信息处理技术到高层的信息内容分析的桥梁,在智能辅助驾驶以及智能视频监控等领域具有非常重要的研究价值。通过在下一帧图像中找
本文对我国博物馆陈列展览的现状进行了首要的阐述分析,并在此基础上,就新时代博物馆陈列展览的创新路径进行了探讨。
社会中各个产业的发展,都离不开其法律的保障和规范。近几年,随着中国旅游业的快速发展,与旅游相关的法律制度也已经初具规模,特别是《旅游法》正式实施之后。国内的旅游市场
自然语言处理已经成为世界各国和各民族信息技术发展过程中至关重要的研究课题之一,伴随着如今大数据时代的到来,更加体现了它的学科优势性,成为了每一个民族信息处理的核心
目的:观察自制根管消毒药物用于前牙窦道型根尖炎根管消毒的临床疗效。方法:选择前牙患窦道型根尖炎,尖周稀疏区〈5 mm的患者200例共200颗患牙,随机分为试验组(100例100颗患牙)和
在科学技术不断发展的今天,不同行业和领域都实行了信息化技术的普及与应用。从社会发展的趋势来看,信息化社会已经对行业的发展产生了巨大的影响。应用数学在信息领域的应用
本文以探索一条网络热点运用与思想政治教育的联动机制的建立路径,解决网络舆情环境下大学生马克思主义信仰和社会主义意识形态“易攻难守”等教育难题和困境,提升大学生思想