设施布局及主题爬虫技术的超启发式算法研究

来源 :南京信息工程大学 | 被引量 : 1次 | 上传用户:Wangqiling1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超启发式算法及其应用一直是计算机理论科学领域研究的重点。研究表明,超启发式算法对于求解NP-hard难度问题和优化信息检索技术的性能和质量十分有效。设施布局问题(FLP)属于NP-hard难度问题,而生产车间合理的设施布局能有效地提升企业生产效益,但目前尚不存在精准而有效的方法来求解FLP的全局最优解。对于信息检索中的主题爬虫(FC)技术,其旨在从整个Web上抓取尽可能多的与特定主题相关的网页,因此如何优化FC技术的全局搜索能力十分重要。本文主要研究多行动态设施布局问题(DFLP)和主题爬虫搜索策略,通过提出几种超启发式算法来求解多行DFLP问题和提高主题爬虫的搜索性能。具体研究内容和方法如下:1)对于多行DFLP问题的求解,本文提出了一种改进的遗传算法(mGA)和回溯搜索算法(BSA)。首先,通过结合使用自适应部分映射交叉(PMX)和自适应混合多种变异策略来提高遗传算法(GA)解的多样性,提出一种求解多行DFLP的改进遗传算法(mGA)。其次,对于一种新的进化算法——回溯搜索算法(BSA),由于其具有独特的初始化、交叉以及变异机制和更强的“记忆”能力,本文通过对其进行改进后引入多行DFLP的求解。最后,将不同算法应用于经典算例进行实验测试,计算结果验证了mGA和BSA算法求解多行DFLP问题的有效性。2)对于优化主题爬虫检索技术,本文提出一种基于本体的主题退火爬虫算法(FCOSA)。在FCOSA算法中,提出了使用基于全局本体和局部本体的超链接二次筛选策略,结合改进的模拟退火算法(ISA),可以有效地拓宽爬虫路径,避免主题爬行陷入局部最优搜索。通过以“暴雨灾害”为主题,实现基于不同优化算法的爬虫策略,发现FCOSA算法是优化FC技术的一种非常有效的方法。
其他文献
艾煊是出生在20年代的当代作家,他的一生经历了抗日战争、解放战争、新中国成立、文化大革命和改革开放等重大时间节点和事件,同时也经历了几次文学范式的重大转变。本文试图对其生平经历和创作历程,在资料收集整理归纳之后进行系统梳理,对其部分作品运用历史的、美学的方法,结合文本细读进行分析,归纳总结出其作品的独特性。本文分为绪论,正文三章和结论三部分,绪论部分是本文的研究目的,国内外研究现状,以及研究的思路
随着互联网技术的进步,社交媒体、电子商务蓬勃发展,越来越多的商品交易评论和社交评论出现在互联网中。因此,网络中的各种评论文本迅速膨胀。若依靠人工的方法难以对网上海量的信息进行收集和处理,因此需要进行文本分析从而帮助用户快速从数以亿计的评论中获取重要信息,情感分析技术应运而生。基于词典法构建一个高质量词典需要大量的人力,机器学习方法过分依赖语句向量的特征,这些特征来自于人工选择导致选择不同的特征就会
桔柚是从国外引进的杂柑类新品种,果实扁圆,果皮金黄色,有蜡质光泽,油胞较突出,果皮较厚,果肉橙黄色,无核,肉质细嫩,多汁,兼有橘和柚的风味。目前主要在福建省南平、三明、宁
目的:本文分析了子痫前期和正常妊娠孕妇胎盘组织及血清中HSP70的含量以及体外低氧状态脐静脉内皮细胞中HSP70、Caspase-3和NF-κB的表达,进一步探讨了 HSP70在临床上子痫前
随着我国纺织工业的迅速发展,印染废水的排放量逐年递增,对水体的污染也越来越严重。目前比较常见的方法大都存在能耗高、单次处理量小、二次污染等问题。针对这些问题,本文
第一部分PEDF/PEDF-R在正常母胎界面的表达及生物学功能[目的]研究正常妊娠妇女pNK细胞、dNK细胞、DSCs表达PEDF的情况,探究PEDF-R在正常早孕蜕膜组织和DSCs上的分布情况及PEDF在母胎界面的生物学功能。[方法]本研究利用流式细胞术检测正常妊娠妇女pNK细胞、dNK细胞、DSCs中PEDF表达情况;检测pNK细胞,及与DSCs和或HTR-8/SVneo细胞(永生化的人绒毛外
纳米多孔材料及纳米颗粒由于其大的比表面积、表面活性被广泛应用于催化、活化、传感、拉曼增强等领域。因此,纳米多孔颗粒有可能具有更好的应用性能。但并不是所有尺寸的纳
目的:明确Cornulin(CRNN)在宫颈癌组织及细胞系中的表达情况;探讨过表达和敲低CRNN对宫颈细胞增殖、迁移和侵袭等生物学行为的影响。方法:于2016年10月至2018年5月收集苏州大学附属第二医院妇科宫颈癌患者手术治疗所切取的宫颈癌组织21例及因子宫肌瘤而全子宫切除术所切取的正常宫颈组织32例,分别采用qRT-PCR和免疫组化检测CRNN基因在宫颈癌组织和正常组织中的表达情况;采用qRT
林业是我国的重要基础产业,发展森林保险,有利于我国林业产业的可持续发展,对转移林业经营风险、发展现代化林业具有重要的意义。本文从森林保险有效需求的角度入手,基于辽宁
图像分类是计算机视觉领域内一个重要研究问题,在自然场景理解和工业检测等图像分析任务中具有广泛的应用。研究高性能图像分类算法对于大规模图像管理和有效组织具有重要意义。而图像的特征表示直接影响分类算法的性能,但在基于图像局部特征的分类算法中,忽略了局部特征之间的关系,并且在使用单一特征对图像进行表示时,可能会丢失部分信息。同时,随着卷积神经网络的兴起,如何融合传统图像特征和卷积特征进而提升图像的分类精