针对PDF的多文件信息抽取的研究与实现

来源 :凯里学院学报 | 被引量 : 0次 | 上传用户:tingyuanzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日常的学习和工作中,PDF文件和WORD文档一样,是一种文件格式.PDF文件有自己的优点,例如不易被误改,但它也有一些不方便的缺点,例如查找文档的信息没有WORD文档方便,特别是在需要查找多个PDF文档是否包含一些用户感兴趣的信息的情况,这就涉及到PDF文件的信息抽取问题.本文阐述了一种使用Java开源工具PDFBox处理相关信息抽取的PDF多文件信息抽取的有效方法.
其他文献
针对薄壁件加工误差在线快速检测的需要,提出一种利用机器视觉技术对薄壁件加工误差进行检测与补偿的方法。通过制作特定标志贴于工件上,用CCD相机获取标志图像;通过数字图像
文章以西门子S7-200为控制单元,结合DOP-A人机界面实现了尾气芳烃的回收处理。该系统分自动和手动两种运行模式,可设置各步骤的工艺参数,人性化的操作及调试功能,便于整套装
我国医疗保险社会化过程中存在覆盖率低、医疗体制改革不到位、管理服务社会化程度低等问题。因此,加强医疗卫生体制与医疗保险改革,加快信息化建设,提高管理服务水平等,是解
近年来中国专利和论文产出均呈爆炸式增长,企业和公共研究机构作为研发创新主力,其创新行为有何特点?是否发挥了各自的比较优势?本文使用2008-2014年国家工程技术研究中心调
新媒体在通讯技术和移动互联技术不断革新升级的支持下飞速发展,用户群不断扩大,影响力持续增强,广告市场也逐渐向其倾斜,其中受影响最大的是以日报、晚报为代表的传统报业。
针对湿式离合器试验过程中磨合状态的预测问题,结合试验过程中摩擦转矩信号的几何结构特征,提出利用多重分形谱及其参数来预测磨合状态的新方法。阐述了基于盒计数法计算多重
肝硬化合并肝胆结石是一种临床常见病,外科手术是较为有效的治疗方法,但手术操作不当、并发症会严重影响治疗效果,甚至危机患者的生命安全。为了降低肝硬化合并肝胆结石外科
【正】近年来,养羊业在国民经济中的比重逐年提高,随着养羊业的蓬勃发展,羊用药物也随之得到广泛应用。如磺胺嘧啶钠针剂用于治疗羊传染性胸膜肺炎;复方磺胺嘧啶钠预混剂预防
会议
目的:探讨65岁以上社区老年人的血脂与中医体质类型的关系,为开展老年人血脂异常中医药防治提供科学依据。方法:回顾性收集广东省中山市65岁以上老年人中医体质辨识及血脂结
本文基于中国家庭营养与健康追踪调查(CHNS数据库)探讨现阶段中国青年贫困现象、影响青年贫困的重要因素,并利用马尔科夫链—概率转移矩阵对青年贫困群体贫困的动态特征进行描述