基于移动Agent的中文信息搜索引擎系统模型的研究

被引量 : 0次 | 上传用户:wangying428
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet规模的迅速增长,网上的信息资源也随之迅速增长。WWW资源的迅速膨胀固然得益于其内在的分布性、开放性和异构性,但也正是这一点,使得用户在网上迅速、准确地获得所需信息变得越来越困难。也就是所谓的“Rich Data Poor Information”。因此,信息搜索引擎是当今必不可少的工具。而如何使搜索引擎更及时、方便、准确地查找到所需的信息,正是本文的研究课题。 本文对信息搜索引擎的研究现状和发展趋势进行了详细的分析和综述,并对移动Agent理论和技术进行了深入的学习,将移动Agent理论应用到信息搜索引擎,建立了基于移动Agent的信息搜索引擎的总体框架,并对其中的一些关键技术做了进一步的论述。利用IDL语言定义了Agent在多种平台上移动的接口,设计了一个符合MAF规范的插件,实现Agent在异种平台之间的移动;利用动态最小生成树算法解决移动Agent的路由选择问题,综合集中式搜索和分布式搜索的特点,动态寻找出一条Agent移动的最佳路线;通过统计分析得到移动Agent克隆的数学模型,通过计算可以获得Agent克隆个数的最佳值。 本文根据中文信息处理的特殊性,在原有的最大匹配分词算法的基础上进行改进,通过引进预处理过程,利用长词优先规则得到一个较好的分词算法。同时,应用数据挖掘技术及Agent技术建立了中文信息搜索模型。该模型通过文档分类Agent调用类层次结构生成算法,实现对搜索到的内容自动分类的功能。本系统构造用户访问模式,采用数据挖掘和机器学习等技术,对日志文件、CGI参数中的信息以及用户发出的查询请求和用户已浏览过的查询结果进行不断的分析,使其具有个性化,能主动地从Internet信息空间中发现和收集用户感兴趣的信息。
其他文献
截至2016年12月22日,2016年度第四批1 2款车型的C-NCAP评价试验及第二批17款车用儿童约束系统产品评价试验全部完成。中国汽车技术研究中心于2016年12月28日在天津公布了该批
阅读是小学语文教学中的重要内容,这部分的学习有利于培养学生搜集信息、提取主旨的能力,同时还可以拓宽学生的眼界。详细分析小学语文阅读教学的现状,然后提出了提升小学语
口服清半夏75%乙醇提取物5g/kg和15g/kg能显著地延长小鼠对热痛刺激甩尾反应的潜伏期,减少由乙酸引起的小鼠扭体反应次数,并能显著抑制小鼠盐酸性溃疡及吲哚美辛-乙酸性溃疡的形成
目的:观察康莱特注射液对胆囊癌术后辅助化疗患者生存质量的影响。方法:将46例胆囊癌术后辅助化疗患者随机分为观察组24例和对照组22例,对照组予以化疗治疗,观察组在对照组基础
目的 建立兔骨髓基质细胞(BMSC)向成骨细胞转化的体外培养方法,并观察其体外的成骨特性。方法 利用静置贴壁原理进行BMSC的体外培养,汇合后传代,部分细胞改用条件培养液继续
中国西部地区民营企业的大力发展,是促进西部地区经济增长和社会全面发展的主要力量;是推进地区经济协调发展和西部大开发顺利实施的带动力量;是优化西部地区产业结构和组织结构
在Co化学机械抛光(CMP)过程中,Co的化学反应活性强于Cu,Co/Cu界面存在较大的电化学腐蚀电位差。采用动电位扫描电化学技术,表征金属铜钴表面的电化学反应。采用降低Cu/Co接触
中国中产阶层的成长一直伴随着某种程度的不安全感和“焦虑情绪”,随着网络自媒体的发展和表达自由度的提高,中产阶层的这种不安全感和“焦虑情绪”进一步发酵和蔓延。现实社
溶葡球菌酶是一种最初从模仿葡萄球菌培养物中分离的含Zn2+金属蛋白酶,具有潜在的抗葡萄球菌药用价值。此文综述了溶葡球菌酶在理化性质、酶学性质、细菌生理学功能、抗菌作
本文采集了1995-2011年的统计数据,运用AIDS模型对我国城镇七个收入层级居民的消费结构进行了实证研究,研究表明,我国城镇居民的消费结构实现了优化升级,不同收入层级家庭消