基于元搜索的知识获取方法与系统集成研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：juwenfeng163

【摘要】

：

互联网已成为企业(组织)获取资讯知识的重要平台,但是现有的这类知识获取工具(代理)不具备通用性,且对于不同领域知识的获取没有灵活的框架和工具。本文针对该问题,运用元搜

【作者】

：

仇绍刚

【出处】

：

大连理工大学

【发表日期】

：

2009年期

【关键词】

：

知识获取元搜索搜索结果聚类信息抽取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

互联网已成为企业(组织)获取资讯知识的重要平台,但是现有的这类知识获取工具(代理)不具备通用性,且对于不同领域知识的获取没有灵活的框架和工具。本文针对该问题,运用元搜索,文本聚类,网页内容抽取等方法和技术将知识获取、分析归类等集成起来,提出了完整的知识获取体系,并构建了灵活的企业资讯知识获取平台,解决了企业(组织)从互联网上获取不同领域知识的问题。本文将互联网作为资讯知识的“矿藏”,围绕从互联网获取外源知识这一核心问题,分析了现有一些方法和工具的不足,提出了各个阶段中对应的解决方法和技术。本文主要从以下几个方面开展研究工作:(1)在知识获取过程中,针对当前搜索引擎覆盖率低,个性化服务不足等问题,提出了利用元搜索原理并构建领域知识库的基本方法;利用元搜索引擎的灵活性,结合概念扩展对关键词进行优化,提高了知识搜索的覆盖率;在搜索结果处理过程中,提出了针对领域知识的调用方法,并对搜索结果依据权重进行指标量化。(2)在知识处理阶段,对元搜索结果进行聚类处理,提出了基于领域内知识获取模型的聚类算法。利用向量空间模型和奇异值分解等方法,将搜索结果分派到相应的可识别的聚类主题描述中,为后续检索和处理提供便利。其中详细介绍了文本表示模型和不同的特征提取方法,并阐述了该聚类算法相对于其他聚类算法的优点,说明其应用于互联网知识获取系统中是合适的。(3)在结果网页的处理阶段,提出了基于节点特征分析的内容抽取方法,该方法的准确性和精确度都达到了系统的要求。将其与基于包装器的抽取方法结合起来,能够自动高效地完成网页主题信息抽取任务。最后,设计并实现了一个基于元搜索的组织知识获取系统,对设计的系统进行了不同领域知识库的试验,对返回的结果和聚类的效果进行了评价,取得了良好的效果。

其他文献

汉代羽人形象试探

“羽人”是汉代艺术中一种特殊的人物造型 ,在汉墓装饰中频频出现。文章通过对考古出土羽人造型艺术品进行的类型分析和艺术形象分析 ,并结合文献资料来揭示“羽人”造型艺术

期刊

羽人形象汉代神仙思想

“词类”是“初始概念”吗?——“词源”语源观批判与浑沌语言观的建立

"词类是初始概念"是汉语词类问题的最新、最重要的观点。这一初始词类观认为,词类随语言产生而产生,语言产生伊始初始词的表述功能即词性。初始词类观背后是整个语言学研究的

期刊

词类本质初始词类观“词源”语源观浑沌语源观

初中数学教学中数学史应用开发研究

随着在数学教育中如何处理数学史角色问题研究的不断深入,数学史在数学教育中的知识整合研究活动也有了长足进展。关于“数学史为数学教育提供了怎样的潜在工具”和“如何在

学位

数学史初中数学教学教学设计

信息不对称情况下建设工程招投标风险及对策

<正>建设项目的招投标是在信息不对称情况下招标方与投标方的一种典型博弈行为,招标方的目的是希望建筑产品造价低、质量高,要求工程项目预期目标达到合理化,而投标方的目的

期刊

信息不对称投标方风险防范招投标阶段招标方建设工程招投标风险及对策

双层复合织物服装辅料的研制

双层复合织物服装辅料是由两层不同面料用粘合剂在专用热合设备上加热复合而成。成本低,使用性能良好,可用于制鞋、服装装饰等方面。介绍了服装辅料的研制过程,包括设备改造

期刊

复合织物粘合剂服装辅料

钉棒系统在寰枢椎骨折脱位中的应用

目的探讨应用后路经寰枢椎椎弓根螺钉固定融合治疗寰枢椎骨折脱位的临床疗效。方法对14例寰枢椎骨折脱位的患者采用后路经椎弓根螺钉固定的方法,行寰枢椎固定。为保证确切的

期刊

寰枢椎寰枢椎半脱位脊柱融合术齿突骨折椎弓根螺钉

香港典型地质遗迹资源与地质公园建设

香港素以金融、商业贸易中心闻名于世界,但香港境内所发育的曲折有致的岩石海岸、幽远宁静的海滩、巍峨多姿的群山、造型奇异的岛礁,弥足珍贵的自然生态和地质遗迹资源却鲜为

期刊

香港地质遗迹地质公园酸性火山岩六方柱状节理

奔向奥运——义务教育课程标准实验教科书小学语文三年级下册期末测试题

<正>2008年北京奥运会——一个国人期待百年的梦想,一场全世界人民共欢的盛宴!2008年,鲜花和激情都将为奥运而铺就,北京将洋溢着中国的光辉。每个中国人都在以不同的方式参与

期刊

实验教科书期末测试义务教育三年级

迷迭香脂溶性抗氧化剂鼠尾草酸的分离纯化研究

迷迭香（Rosmarinus Officinalis L.）,是一种新兴的药用植物,其中富含多种抗氧化活性成分,具有抗氧化、抗病毒、抗肿瘤、抗菌、抗炎等一系列重要的药理功能。由于它的功能颇多,

学位

鼠尾草酸迷迭香酸鼠尾草酚硅胶柱层析匀浆

我国政府绩效管理问题研究

在当今西方各国的行政改革过程中,绩效管理作为先进企业的成功经验得到政府的普遍吸收和借鉴,并已演变成当今西方各国实施政府再造、实施政府改革、落实政府责任以及改进和评

学位

政府绩效管理问题启示对策

基于元搜索的知识获取方法与系统集成研究

与本文相关的学术论文