基于信息集结算子的Web信息检索方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：zhaoyangfei1

【摘要】

：

信息检索的研究已有多年历史，自World Wide Web (WWW)产生以来，如何在海量的信息资源中检索到有用的信息更成为一个非常重要的课题，同时这方面的研究也有了一定成果。Yager提出

【作者】

：

武兴龙

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2007年期

【关键词】

：

Web信息检索元搜索引擎有序加权平均算子检索模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

信息检索的研究已有多年历史，自World Wide Web (WWW)产生以来，如何在海量的信息资源中检索到有用的信息更成为一个非常重要的课题，同时这方面的研究也有了一定成果。Yager提出的有序加权平均算子(Ordered Weighted Averaging Operator)已经广泛应用于决策分析、专家系统、人工神经网、模糊系统等方面。它提供了广泛的包括极大、极小和算术平均的参数化集成算子，并可以应用于各种信息集成问题中。如何将OWA应用到Web信息检索是一个非常值得考虑的问题。 Web 信息检索系统作为用户层和 Web 信息层之间的中间层，可以进一步地划分为3个层次，包括：搜索引擎与目录、元搜索引擎、信息检索Agent 。本文就是按照搜索引擎、元搜索引擎、Agent三个层次提出了基于OWA算子的Web信息检索模型，旨在寻找提高网络信息检索效果的手段和方法的有效途径，并最终提高网络信息的检索效果，使得网络信息资源得到充分有效地利用。全文主要包括七个部分：第一章对信息检索及 Web 信息检索的研究现状进行了综述，为下文的进一步研究奠定了基础。第二章详细阐述了Web信息检索层次分类，介绍了几种传统信息检索模型，包括布尔模型、向量模型、概率模型、概念模型，并且阐述了Web信息检索中的信息集成问题，综述了各种信息集结算子。第三章提出了用户查询含数值权重的扩展的布尔信息检索模型。此模型中，文档采用了一种改进的关键词频率一逆频率(TF、-IDF)方案，查询表达式用带有数字权重的检索关键词表示。然后采用自下而上的匹配策略，用调整的几何平均算子和有序加权平均算子进行信息集结，最终得到了每个文档对查询表达式的检索值。第四章建立了基于OWA的用户查询含语言值权重的扩展的布尔信息检索模型，这个模型与上个模型的不同在于在查询语句中用语言值权重代替数值权重。匹配策略也是自下而上的，最终得到了每个文档对查询表达式的检索值。第五章建立了基于OWA进行结果融合的元搜索引擎模型。本章中用OWA算子进行结果融合：首先计算每篇文档在每个成员搜索引擎各自的检索结果中的位置值(Position Value)，然后针对位置值的大小进行结果的集结，即融合。第六章建立了一个信息检索Agent模型，该模型中阐明了从用户Agent 到信息源的五个层次，并给出了工作流程，其中用到OWA算子。第七章是结论和展望。另外，本文对每个模型都有简单的算例，以便更好的说明算法。

其他文献

山东农业大学学报1992年总目录

作物新型小麦雄性不育系一K、V型初步研究…孙兰珍高庆荣崔德才王桂荣23(l):1冬小麦生育后期的群体光合作用与物质生产能力…岳寿松元新华余松烈23(1):9高产麦田群体结构与光

期刊

土壤水分胁迫高产麦田籽粒蛋白质含量李永昌物质生产能力青山羊雄性不育系棉花高产栽培孙兰珍亲本自交系

充分利用气候资源积极发展秋麦

原来曲靖专区冬播旱地小麦,整个生长过程,都处于冬春干旱季节,加之或轻或重的晚春霜冻,致使产量低而不稳,一般亩产几十斤到百多斤。近年来利用大春洋芋收后。小春播种前百天

期刊

旱地小麦气候资源收后曲靖专区冬播粮食产量二至霜冻东关季秋

家蚕新品种——赣_2简介

赣_2是我所于一九七四年春季利用现行品种“东_34”为材料,采用CO~(60)照射蚕蛹,经过三年十一代的选择与培育,在7000伦琴中选育出性状稳定、茧质优良、好养、高产符合选种目

期刊

配合力杂交优势九七顶交茧质蚕蛹解舒率解舒丝长丝质夏蚕

柽麻留种试验初报

柽麻是一种从南方引进的夏播豆科绿肥作物,在我省适于作麦茬复种的绿肥。但是,在我省推广柽麻种植中有一个严重问题就是留种困难,种子产量低,亩产只有20～30斤。为了找出柽麻

期刊

柽麻豆科绿肥种子产量种植技术绿肥播期栽培技术措施因子合理密植花数

考虑时间约束的共同配送研究

近些年来,日本和欧美等发达国家在共同配送领域不断发展,取得了优异成绩。这种既可以带来社会效益又可以带来经济效益的物流模式,正逐步为国人所关注。然而,近些年出现的“消

学位

共同配送时间约束混合整数规划问题多种配送方式

Resource allocation in OFDMA heterogeneous networks for maximizing weighted sum energy efficiency

In this paper, a resource allocation algorithm for maximizing the weighted sum energy efficiency(EE) is investigated in orthogonal frequency division multiple a

期刊

allocationOFDMAheterogeneousmaximizingiterativeguaranteeassignmentheurist

沿江棉区高效益熟制问题的探讨

本文阐述了沿江棉区熟制的演变;分析介述了不同类型熟制的经济效益和配套技术;讨论了发展高效益熟制需做好“四良”配套等问题;提出了当前沿江棉区只有因地制宜,走立体多熟、

期刊

熟制“四良”配套沿江棉区油菜产量壮苗早发杂交油菜种植方式花铃期自然生态条件植棉面积

电度表质量分析与应用选型决策支持系统

电力行业是我国信息化较早的行业之一，计算机应用和电力通信经过几十年，特别是近二十年来的建设和发展，已经初具规模。今后电力行业信息化应在在数据共享的基础上，更进一步加强辅

学位

决策支持系统数理统计模型质量分析电力行业

1991年江苏省审定通过的农作物新品种

1.水稻品种1.1 扬辐籼2号1.来源和类型:原名“381”。江苏省里下河地区农科所以IR1529—68—3—2用CO~(60)—r 射线辐射,于1987年育成。属中熟中籼稻品种。2.特征酶性:丰产

期刊

籼稻品种里下河地区作物新品种稳产性射线辐射蛋白质含量农作物品种审定翼板

复杂网络视角下我国汽车企业的知识网络研究

我国整车制造业自改革开放以来得到了长足的发展，尤其是在我国加入世贸组织以后更是进入快速发展期。同时随着经济全球化和知识经济的到来，我国汽车产业也面临着两大挑战。一是

学位

汽车企业知识网络产品品质市场竞争力复杂网络理论

基于信息集结算子的Web信息检索方法研究

与本文相关的学术论文