文档结构识别相关论文
近年来,流式文档广泛地应用在社交、媒体、办公以及出版等领域。面对海量的流式文档,如何使计算机自动、准确地理解文档成为了各行......
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单......
针对采用机器学习方法识别流式文档结构时语料库稀少、语料标注复杂的问题,该文在研究文档的逻辑结构和编辑语义特征的基础上,确立......