一次性条件下(δ,γ)模式匹配

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:uuuiiiuuui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式匹配是计算机领域中对字符串的一种基本运算,目的是在较长的序列中找出与给定模式相同或相似的所有子串。模式匹配在诸多领域中具有广泛的应用,如搜索引擎,金融分析,数据挖掘等。与传统模式匹配相比,带有间隙约束的模式匹配更具灵活性,其允许模式中包含指定范围的通配符数量,具有重要的研究意义。在一次性条件下的模式匹配中,模式中包含间隙约束且序列中同一位置的字符最多允许被模式使用一次,这种方法在生物信息学和序列模式挖掘等多方面具有重要的应用。与精确模式匹配相比,近似模式匹配不仅更具一般性,而且能够允许一定程度的数据噪音。但是目前大多数研究是海明距离下的近似模式匹配,这种匹配只关注整体差异,而忽略了局部字符间的近似程度,导致近似匹配结果存在较大误差。为了解决这个问题,本文在一次性条件下研究一种局部距离不超过δ且整体距离不超过γ的近似匹配,即一次性条件下(δ,γ)模式匹配问题(Delta and gamma Pattern matching under One-off condition,简称DPO)。本文首先给出问题的形式化定义,理论证明了该问题的计算复杂性为NP-Hard问题,然后将DPO问题转换为一棵δ-近似网树,并提出了一种启发式求解算法NetDPO(approximate Nettree for DPO)。该算法通过计算每个结点在γ距离内可达根结点的路径数,优先选择位置相关数较小的双亲结点,从而降低出现与δ-近似网树的相关性,得到一个局部最优解。在此基础上,结合最右双亲策略,选择两者中剩余出现数较大的出现,从而得到一个全局最优解。迭代此过程,最终找到DPO问题的最大解集。最后理论分析了NetDPO算法的空间复杂度和时间复杂度,并通过大量实验验证了本文所提算法在求解质量和近似匹配效果上的优越性。
其他文献
随着居民对建筑美观要求的逐渐提高,异形柱被广泛地应用于建筑中。但普通钢筋混凝土异形柱存在承载能力不足、轴压比限值较低及抗震性能较差等问题,因此建议采用内置钢骨进行增强以形成钢骨混凝土异形柱结构。这样不仅能够发挥异形柱的结构的优势,而且能充分发挥钢与混凝土两种材料的性能,现有文献缺少足尺钢骨混凝土异形柱的研究,因此有必要开展钢骨混凝土异形柱的拟静力试验。对四种同截面不同剪跨比的新型钢骨-栓钉-混凝土
预测电流控制是一种基于预测模型的电机控制策略,由于电机预测模型中存在大量的电机参数,导致该算法对参数十分敏感。在实际应用中,电机参数无法被准确测量并且会随不同的工作条件发生改变,导致预测模型中的电机参数与实际参数之间存在偏差。电机参数偏差将导致预测模型不准确,使预测控制系统出现预测误差,严重时会造成控制性能下降等现象,因此预测电流控制的误差分析与补偿研究非常重要。本文主要对永磁同步电机(Perma
随着国家经济的高速发展,基础设施建设的发展规模日益增多。然而对于中国中西部的多数山区来说,由于受地质地貌条件、空间场地等因素的制约,高填方边坡的设计和施工也就成了该地区机场、路堤等基础建设中必不可少的关键环节。有效控制高填方边坡的变形是提高其稳定性的重要评价标准。本文对自主研发的一种新锚固系统—放射状锚索系统进行了深入研究,该系统能有效提高锚索在填方体中抗拔能力,抑制高填方边坡沿填方体-陡基岩界面
Cr/N涂层因为具有高硬度,高韧性和高耐磨性以及良好的耐腐蚀性性能,近年来被材料工作者广泛研究与创新。铝合金因其重量轻,比强度高,优良的耐热性和较高的疲劳强度,被广泛应用于航天航空,汽车,建筑材料等产业,已经成为使用量仅次于钢铁的第二大金属材料。但低硬度,耐磨性差,不耐腐蚀等缺陷又限制了铝合金的使用。为提高铝合金使用性能,将表面处理技术应用于铝合金已经成为新的研究热点。因此,本文针对提高2024铝
针对重金属污染及农业废弃物的二次利用问题,本文以蛋壳和桔皮为原料制备出吸附剂,并采用三种吸附工艺去除废水中的铅、镉和铜。蛋壳对铅、镉和铜的最大吸附量分别为149.3 mg/g、31.79 mg/g和17.90 mg/g,吸附过程符合拟二级动力学模型和Langmuir等温吸附式;桔皮对铅、镉和铜的最大吸附量分别为139.5 mg/g、33.94 mg/g和33.11 mg/g,吸附过程符合拟二级动力
AlGaN基深紫外发光二极管(DUV LED)在灭菌消毒、医学治疗、紫外加工和农业等领域具有很大的应用潜力。然而,具有高外量子效率(EQE)的DUV LED仍然很难获得,EQE的发展缓慢很大程度上是受到光提取效率(LEE)低的限制,当前DUV LED的LEE普遍低于10%。LEE低的主要原因在于:第一,由于空气和AlGaN之间的折射率差异大,LEE受到全内反射(TIR)和菲涅尔损失严重影响;第二,
近几年来,随着极大规模集成电路的飞速发展,工艺技术节点降至7 nm及以下,集成电路制造工艺越来越复杂。传统的插塞金属钨由于其沉积过程中急剧增长的电阻已不能满足现代制造工艺的需求,可使用电阻率较低(6.63μΩ·cm)的新型插塞金属钴(Co)代替。化学机械平坦化(CMP)是集成电路制造工艺的关键步骤之一,是到目前为止实现晶圆表面部分或全局平坦化最有效的手段。阻挡层CMP是多层铜布线的最后一道工序,阻
光伏电池片中的裂纹缺陷会造成电池片失效,影响电池组件的正常使用,也不利于光伏发电系统维持稳定。光伏电池片电致发光(Electroluminescence,EL)图像呈现非均匀复杂表面,随机分布的晶粒和缺陷目标之间的对比度低,缺陷形状、尺度不一等特点,给利用传统方法对裂纹缺陷的准确性和鲁棒性检测带来很大的挑战。因此本文提出了多个深度学习模型,有效地解决了复杂背景对裂纹缺陷识别的影响,最终形成了一套有
化学机械平坦化(CMP)是集成电路(IC)制造的关键工艺之一,是实现多层铜布线局部和全局平坦化的核心技术。阻挡层平坦化是铜互连CMP制程中的最后一步,决定着IC器件的良率和可靠性。钽(Ta)具有较高的电导率和抗电迁移性,并与Cu有很好的粘附性,被广泛用作铜互连的阻挡层材料。在阻挡层CMP过程中,由于Cu/Ta两种金属活性的不同,会形成电偶腐蚀,而且CMP抛光液中部分组分也会对铜表面造成腐蚀,影响器