文档理解相关论文
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单......
结合文档内容理解、文档的分类、文档格式的检查与纠错、文档的互操作以及文档的智能处理等多种关键应用领域,讨论了文档格式信息......
文档图像理解中最重要的部分是逻辑结构的提取。目前的研究主要集中在页面的布局分析上,少数对文档逻辑结构的研究只是针对单页文......
本文介绍了英文标书文档处理系统VHTender的设计和实现过程,该系统能够从纸质标书的扫描图象中抽取文档信息将其转换成电子标书。......
在数字图书馆建设中,一个急需解决的问题是如何自动化地将海量的纸张图书数字化为电子文档。对于生成图书电子文档而言,除了文档内......