遗传算法在主题Web信息采集中的应用研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:squllwu20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法。通过此算法,利用元搜索技术可进一步提高网络蜘蛛的性能,具有更高的查全率和查准率,能够较好地解决现存问题。
其他文献
现在许多人脸识别算法都是在假定每个人提供了多幅训练样本的情况下展开的,对每人只有一幅训练图像的识别问题研究得很少,而实际中往往每人只提供了一幅图像。本文对这一问题进行了研究,给出了一些生成虚拟训练样本的方法;提出了基于类间散度最大的二维主分量分析方法,在 ORL 库上用单训练样本取得了75.28%的识别结果。
电子商务的发展给了拍卖以勃勃生机,网上拍卖迅速成为一种非常活跃的商务模式.目前网上拍卖绝大多数只有一个价格属性.本文提出一种新的拍卖模型--多属性网上拍卖,其最核心的
运用Stackelberg主从对策思想中提出的定产量决策方法,首先,对包括3个参与方(单供应商和两个分销商)的供应链在不同的合作方分别居于主方地位假设下的转移定价决策进行了研究
风险价值理论能够很好地从心理和行为方面综合考虑收益与风险之间的决策。本文将风险价值指标引入组合投资领域,通过极大极小风险价值,建立了相应的组合投资模型(MMRV),并与其他
需求不确定下,供应链产品的供给变化总是滞后于市场需求的变化,供应链存在时滞,其结果会导致产品供需间出现明显的非线性关系.突变理论通过特定的几何形状对许多参数连续变化
在OLTP应用中数据库集群是一种有效的并行处理方案,由于以前对数据库集群特别是异构情况下的性能评价不够完善,本文主要研究数据库异构集群的性能模型,分析了CPU和内存两种资源
网络组织是在现代信息技术的支撑下,企业适应快速变化的、复杂的市场需求的产物,是一种新的组织形成.阐述了网络组织的含义,然后系统地研究了网络组织的结构、类型及特征,以
图像逆映射是基于图像绘制技术的基础算法,但由于需要进行繁琐的参考域搜索过程,传统图像逆映射算法计算复杂度大、效率低。本文提出一种快速图像逆映射算法——搜索转移算法。该算法从场景的极线几何性质出发,将大量匹配搜索过程从参考域转移到目的域中进行,由于在目的域只需进行简单的判断操作,因此可以大大降低整体的匹配复杂度;同时,算法充分利用场景的空间连贯性,通过为目的域制定自适应的绘制顺序,有效地减小了实际需