字符分布特征对带有通配符串匹配问题的影响

来源 :计算机应用研究 | 被引量 : 43次 | 上传用户:chenan110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,字符串匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符,称之为PMWL问题。针对此问题,已有工作分析了在不同的模式特征下,匹配数Ω随文本长度增加呈指数级增长。同时考虑文本分布特征和模式特征,建立了期望模型E(Ω)=n Dπ(P),其中n为文本长度,D为模式中各通配符跨度的乘积,π(P)为基于字符分布的模式出现概率。实验部分,在人工随机数据和DNA真实数据上验证了E(Ω)的准确性,得到预测误差率分别为1.8%~3.2%和4.7%~7.8%;在不同字符分布中,分析了模式模长和
其他文献
互连网络的故障诊断是网络系统可靠性分析的重要内容。PMC模型是一种重要的网络故障模型。针对具有哈密顿环的互连网络(也称做哈密顿网络),利用分治回环思想,提出了一种新的基于PMC故障模型自适应的诊断算法。其核心思想是,对哈密顿网络进行序列划分,然后对得到的每个01序列的结节进行回环诊断,最后利用回环诊断的结果对非01序列的节点进行诊断。对于一个具有多个01序列的互连网络,该算法通过有限次轮回的测试,
传统遗传算法存在早熟现象,而且其在海量数据模型下的求解精度和可扩展性也有待提高。为了改进上述问题,在研究孤岛模型和细粒度模型优势基础上,利用遗传算法自身的并行性,提出一种仿细粒度的粗粒度并行模型,基于Spark实现了一种双层并行的遗传算法。将改进算法应用于旅行商问题Berlin52数据集的求解,实验结果表明,与传统的并行模型相比,改进后的算法可以明显缩短计算时间,增大搜索范围,早熟现象也得到了改善
为了能够有效提高虹膜检测和定位的质量、准确性和速度,排除光线照射、噪声或是拍摄的角度等不利因素对定位结果的影响,提出一种虹膜的定位算法。该方法首先在对图像进行预处理的基础之上,运用共形几何代数理论的思想,将欧氏空间中的几何量变换到共形几何代数空间中去,这些几何量在共形几何代数空间中都是以统一的矢量形式表示,从而使这些几何量之间的计算更加方便、简洁;最后借助Radon变换对目标圆,即虹膜的内外圆所在
针对用户评论中产品特征—观点对的提取及情感分析问题进行了研究。为了提高提取及分析的准确性,利用组块分析提取产品特征,从中寻找到频繁项集,并用逐点互信息量(PMI)对候选产品特征进行过滤,得到产品的特征集合;利用特征与情感词在位置上的邻近关系,提取情感词并组成特征—观点对,通过点互信息方法(SO-PMI)进行情感倾向分析。为验证该方法的有效性,以酒店评论文本为例,从中提取酒店的特征—观点对并进行情感
在基于分解技术的多目标进化算法的框架中,引入一种动态多策略差分进化模型。该模型在分析不同差分进化策略的特点基础上,选择了三种差分进化策略,并对每种策略分配一子种群。在进化过程中,依据每种策略对邻域更新的贡献度,动态地调整其子种群的大小。对比分析采用不同差分进化算法的性能,结果表明运用多个策略之间相互协同进化,有利于提高算法性能。将新算法同NSGA-Ⅱ与MOEA/D算法在LZ09系列基准函数上进行性
针对原有基于判决方程的子区间消除算法中所存在的判决结果与决策表不相符,以及当子区间划分规模增大时运行时间呈平方次增长的问题,提出了一种全新的基于动态规划的子区间消除算法。新算法充分利用动态规划在多阶段决策问题中的卓越性能,将子区间的消除问题划分为合理性判断和新区间生成两部分,这两个部分均可以利用动态规划中子问题分割的思想来解决;证明了通过解决这些子问题可以构造得到原问题的最优解,分析了算法的时间复
CT增强扫描时对比剂给药方案影响对比剂用量以及增强图像强化效果。为了使同类型CT增强检查获得一致性好的高质量图像,分析了影响CT增强图像质量的因素,建立了CT增强给药方案专家知识库,基于SSH框架、采用Java开发了CT对比剂智能应用专家系统。该系统能与医院已有的HIS及RIS对接接收患者信息、就医信息、设备信息等参数,系统的推理机自动匹配输入信息及专家知识,为操作者提供最佳CT增强检查方案。
针对设备状态分析中不精确的时间信息与观测信号相互作用引发的复杂状态演化过程难以回溯的问题,提出一种基于时间约束可能性Petri网的设备状态模型和分析方法。该方法在时间相容性分析的基础上层次化地分解状态演化中的复杂关系,从而将模糊的因果关系清晰化,以降低问题的求解难度。仿真实验和对比分析表明,提出的方法是一种有效的设备状态分析方法,同时也降低了过程分析的计算复杂度。
针对医疗领域的研究,发现了不同科室间电子病历存在着差异,但是新语料的标注成本又非常高。为了解决这一问题,利用迁移学习的方法在中文电子病历中进行跨科室组块分析的研究。在构建的中文电子病历中,对比了SSVM与CRF模型在词性标注和组块分析上的实验结果,发现SSVM模型的效果更好并选择该模型作为基本标注模型;此外,使用了改进的结构对应学习算法(SCL)进行组块分析,使得该算法能适用于SSVM模型进行领域
为了扩展空间故障树SFT理论,研究可表示工作环境影响的元件维修率,借助Markov链理论对元件维修率分布进行推导。所研究系统的特点为由相同元件所构成,进而使Markov链中失效率和维修率相同。用SFT中的特征函数代替Markov链中失效率,并根据实际情况设定状态转移概率,从而可得SFT下的元件维修率分布。维修率分布是由工作环境因素作为自变量的函数,考虑工作时间t和工作温度c影响下,对一混联系统进行