基于神经网络的印刷体数学公式抽取方法

来源 :计算机应用研究 | 被引量 : 6次 | 上传用户:wjyjiedabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与BP神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用BP神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。
其他文献
结合动态能量管理机制,对AC-MAC协议更合理地控制无线收发器的状态转换次数,即在保证了低延迟和高吞吐量的同时,又减少了潜在的能量消耗。
基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文搜索的实现中,全文检索用户界面层采用ASP.NET开发,应用业务层采用C#语言。
ICU复杂文本布局引擎与其他应用较为广泛的复杂文本布局引擎相比的一大长处是它的开放源代码。通过分析ICU源码,并以此为基础设计新的复杂文本的布局引擎。首先简要介绍了复杂文本布局引擎的一般原理,然后以复杂文字语言蒙古文为例,详细探讨了基于ICU的复杂文本布局引擎的设计思路和方法,最后对复杂文本布局引擎的跨平台应用进行了深入研究。
针对日面活动的多样性和复杂性,采用高性能的数字视频处理技术——达芬奇技术设计了日面活动图像处理与识别系统(SIPRS)。首先从SIPRS的系统架构出发,对系统的硬件设计进行了分析,特别是对DM6437与数字相机MDC1004之间的接口进行了详细的分析;在软件上按系统功能需求规划出八个核心任务,实现了SIPRS基于Web的远程系统配置及日面活动图像的预处理、处理和识别功能。整个系统采用高性能数字媒体
改进了Shoup的方案,并使用可验证秘密共享技术提出了一种可验证的门限RSA签名方案。改进方案与Shoup原方案和王的方案相比,安全性相同,并且性能更好。
随着Internet应用的普及和Web技术的发展,基于Web的工作流管理服务为异地办公及跨企业的合作提供了良好的基础,采用Web技术已成为新一代工作流管理系统的主要特征。为了进一步提高其灵活性、可维护性和可扩展性,提出了一种基于Web Portal的工作流客户端的思路,并给出了体系结构的设计以及主要的实现技术。
为了有效访问基于位置服务(LBS)环境中的服务信息,提出了基于移动agent和元数据的LBS信息查询新思路,给出了构建LBS信息查询系统的方法,并利用移动agent开发平台Voyager和Java系列软件开发了一个分布式的LBS信息查询系统,实现了在LBS系统中信息的透明访问。
在分布式计算中,一个重要的问题是如何验证远程计算机系统的状态。以可信计算联盟(Trusted Computing Group)的可信平台模块为基础,提出一种安全验证远程计算机系统状态的方法,并在Windows系统上实现。通过该远程证实系统,远程的挑战者能够获得证实系统(被验证的系统)运行时的状态。
简要介绍了ISO通用访问控制框架,比较详细地阐述和分析了当前几种主要的访问控制框架理论及其在Linux中的实现,对这几种访问控制框架的相同点和不同点进行了比较,最后指出了这些访问控制框架存在的一些问题及今后的发展趋势。
在深刻理解Web服务QoS的基础上,用模糊数学理论对其进行描述、评价、决策,以提高Web服务的QoS,使Web服务提供商在商业竞争中处于领先地位。