一种基于特征的文档图像检索方法

来源 :2008年全国模式识别学术会议 | 被引量 : 0次 | 上传用户:z7120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种综合利用文档图像的段落特征和局部象素分布相对差特征,并借助多维数据索引结构进行文档图像检索的方法。首先给出了段落特征和局部象素分布丰日对差特征的定义,然后给出了段落特征和局部象素分布相对差特征的提取方法以及基于这两个特征结合使用的检索方法,段落特征这一全局特征以及局部象素分布相埘差特征这一局部特征相结合能够较好地表征和区分文档图像,保证了检索的准确度,检索算法中引入的多维数据检索结构提高了检索的速度。
其他文献
材料内部的应力集中通常导致材料的失效,对材料内部应力场和破坏机制的研究,有助于新型材料的设计开发。对钨基复合材料材料内部应力场进行研究,结合钨基复合材料材料特有的组织结构建立数学模型,采用有限元数值计算的方法,利用有限元软件的手段,模拟钨基复合材料内部的应力场分布。分析计算结果表明,钨基复合材料应力场的分布,并非如先前所认为的首先在粘结相中发生应力集中,而首先出现在高强度的钨颗粒中。
针对Crl2钢模具在线切割过程中出现开裂问题。采用光学显微镜、电子显微镜、化学成分分析和硬度测试等方法,对失效模具材料进行了检测和分析。分析结果表明,Crl2钢模具淬火时间不充分,回火不足,热处理后保留在模具原材料中的残余应力是开裂的主要原因;Crl2钢冶金质量差,材料中碳化物呈严重网状分布,锻造不充分,碳化物粗大且有棱角是该模具更易开裂的材料因素。
通过进行断口观察、金相检验、化学分析、硬度检验等,分析了导致Crl2MoV模具在线切割中产生开裂的原因。热处理引起材料内的残余应力较大,线切割时残余应力重新分布,在模具线切割局部边缘产生超过材料拉伸强度极限的拉应力是磨具开裂的主要原因。共晶碳化物严重超标,是该磨具材料开裂的另一原因。提出了改进模具寿命的建议。
人耳检测是人耳识别系统的首要环节,这一环节的检测效果直接影响了整个识别系统的性能。本文根据人耳的自身结构特点,针对传统AdaBoost算法在人耳检测中的不足之处进行了有效改进。本文主要进行了三方面的工作:通过改变弱分类器的权重分配,影响检测器性能的侧重点,进而降低误检率;引入排除阈值的概念,在训练过程中抑制噪声样本,提高检测器的鲁棒性,防止过学习现象的出现。最终获得的检测器在CAS-PEAL库等三
针对无线通信需要保证数据传送的服务质量问题,利用SOM神经网络实现了对QoS模式空间的汇聚,并将聚类结果应用到传感器网络最短路径求解算法中。文中构建了测试无线传感器网络丢包率的Simulink模型,并对不同通信距离和噪声功率密度下的丢包率进行了测量,得到了SOM网络的输入样本集。经过网络训练后,得到汇聚后的权向量矩阵和相应的服务质量函数。最后,将服务质量应用到最短路径树构造当中,并利用NS2软件验
针对现有变压器故障诊断方法在诊断性能、适用性及知识获取等方而存在的不足,利用人工免疫系统强大的识别、学习能力和粗集的属性客观约简,提出一种融合粗糙集理论的变压器故障免疫诊断方法。文中详细分析了基于粗集的抗体抗原编码优化和模型的免疫诊断与学习算法。最后通过实验证实,该方法诊断准确率高,具有鲁棒性和良好学习能力。
随着生物特征识别产业的迅猛发展,其产品的质量控制问题日趋重要。而对作为生物特征识别产品核心部分的识别算法的测评,则成为了非常重要的一环。这套生物特征识别算法测评方法及系统就在这种背景下,根据现实科研项目的需求开发的,它具有自动化,多模态,跨平台等特性。本文就将对该系统进行介绍。
在互联网的时代,网上信息爆炸性地增长,人们希望在网络世界中快速、准确地找到自己需要的信息。现在以关键词或天键词的简单逻辑组合为基础的信息检索方式在一定程度上已经不能满足人们对信息获取的要求,智能问答系统为了满足人们的这种要求而逐渐地发展起来的。本文围绕限定领域内智能问答系统的设计与实现,针对领域知识库构建、问句理解分析、FAQ问句匹配等关键技术进行了一系列的研究探讨。FAQ库问句匹配采用句子相似度
基于决策树理论的上下文相关声学模型在英语、汉语音识别中已经得到了比较深入的研究和应用,但在蒙古语语音识别中的应用较少。本文基于决策树理论建立了蒙古语语境相关模型-三音子模型,并将摹于决策树的模型状态捆绑策略运用到蒙占语语音识别系统声学模型的构建中。文中在隐马尔可夫模型工具HTK平台上对不可见三音子与稀疏三音子分别进行了实验分析,取得了较为满意的效果。
语句及篇章的韵律结构和信息结构的分析和模型化是提高语音合成的自然度、降低自然语言识别错误率的关键。本文在带有韵律标注ASCCD语料库的基础上对韵律短语的时长和音高特性进行了研究,得到并验证了如下一些结论:(1)韵律短语边界对音节时长有明显的延长作用,不同声调对音节的时长延长作用不同,并且不同的重音级别对音节时长的延长作用也不同。(2)韵律短语边界处中断的时长在较小的韵律边界表现的更为明显。韵律短语