提取方正排版文件广义元数据并生成全文HTML的探索

来源 :中国科技期刊研究 | 被引量 : 0次 | 上传用户：zhuyanyan09eight

【摘要】

：

【目的】实现自动提取科技期刊全文元数据并生成HTML文件。【方法】以方正排版文件为对象,在可以提取出来文章的标题、摘要等元数据的基础上,将文章的正文内容元数据化,提出

【作者】

：

杨海亮徐用吉

【机构】

：

东北大学学报编辑部,

【出处】

：

中国科技期刊研究

【发表日期】

：

2016年02期

【关键词】

：

广义元数据方正BD排版语言 VB编程软件自动全文提取 HTML文件

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

【目的】实现自动提取科技期刊全文元数据并生成HTML文件。【方法】以方正排版文件为对象,在可以提取出来文章的标题、摘要等元数据的基础上,将文章的正文内容元数据化,提出了包含图、表、公式等的广义元数据概念,并建立了提取图、表元数据的提取规则,同时将方正排版数学公式转化为La Te X表达式。然后利用VB编程软件编写了自动提取广义元数据程序并将元数据重新组合生成HTML格式的文件。【结果】根据方正BD排版语言的特点,建立的提取规则能有效提取全文并元数据化,最后可直接生成HTML文件。【结论】实际应用表明了利用广义元数据生成HTML文件的有效性和可行性。【Objective】 To automatically extract the full text metadata of scientific journals and generate HTML files. 【Method】 Based on the Founder typesetting documents, based on the metadata such as title, abstract and so on, the text content of the article can be metadataized. The concept of generalized meta data including charts, tables, formulas, At the same time, the formula of Founder layout math is transformed into La Te X expression. Then use VB programming software to write automatic extraction of metadata programs and metadata reorganization to generate HTML format files. 【Result】 According to the characteristics of Founder BD typesetting language, the extraction rules established can effectively extract the full text and metadata, and finally generate HTML files directly. 【Conclusion】 The practical application shows the effectiveness and feasibility of generating HTML files using generalized metadata.

其他文献

来氟米特在肾脏病中的应用

来氟米特是一种新型选择性抑制T细胞和B细胞增殖的免疫调节剂,它在治疗类风湿关节炎方面有可靠疗效.目前尝试将它用于肾移植、狼疮肾炎、肾小球肾炎、间质性肾炎中,并取得良

期刊

肾移植狼疮肾炎肾小球肾炎肾炎间质性来氟米特

雷贝拉唑联合治疗反流性食管炎的临床研究

目的评价雷贝拉唑联合莫沙必利和铝镁加治疗反流性食管炎的临床疗效。方法将127例反流性食管炎患者随机分为治疗组（63例）和对照组（64例），治疗组给予口服雷贝拉唑、莫沙必利和铝镁

期刊

雷贝拉唑反流性食管炎莫沙比利疗效

高血压病中西医结合诊疗方案治疗高血压75例

目的:确定眩晕(高血压)中西医结合治疗方案的近期疗效和安全性,为进一步优化诊疗方案奠定基础,以求建立疗效更为确切的高血压中医药综合诊疗方案。方法:选择本院门诊及住院的

期刊

高血压病/中西医结合疗法肾阳虚/治疗应用辨证分型长效钙拮抗剂(CCB)/治疗应用

草坪修剪机常见故障的判断与维修

1.草坪修剪机在启动和停车时出现剧烈异响造成上述故障的原因是刀片中心螺栓未拧紧。如果发现该故障,应将螺栓拧下,取下联刀器和刀片,检查有无损坏,如果有损坏,更换新的,然后

期刊

修剪机火花塞发动机常见故障

译者主体性的限度——试论译者主体性与“忠实”之准则

译者主体性一直是近年来翻译界的热点话题。在前人对译者主体性研究的基础上，笔者首先肯定了译者是翻译的主体，并讨论了译者主体性的内涵及其客观制约因素，提出“忠实”是翻译永

期刊

译者主体性限度忠实辩证统一

对两类未定式极限求解方法的几点思考

对于两类基础未定式:"0/0"型以及"∞/∞"型未定式的极限,通常是通过洛必达法则求解。但是其中存在一些题型若直接利用洛必达法则进行求解,会使解题过程复杂难解甚至无法求出

期刊

“0/0”型和“∞/∞”型未定式的解法洛必达法则初等恒等变换等价无穷小

关于会计专业ERP教学的几点思考

开展ERP理论与实践教学对培养应用型会计人才具有积极作用,但教学实践中,也存在一些问题。本文总结了ERP实践教学的经验,探讨了教学中存在的问题,并提出了改革会计专业ERP教

期刊

会计专业ERP教学情境教学

天津市人民政府办公厅关于成立天津市人民政府推进职能转变协调小组的通知

<正>津政办发[2015]40号各区、县人民政府,各委、局,各直属单位:为深入推进简政放权、放管结合,加快政府职能转变,市人民政府决定成立天津市人民政府推进职能转变协调小组(以

期刊

人民政府天津市人民政府办公厅简政放权

大学生解释偏向、孤独感对手机成瘾的影响

随着智能手机的普及,大学生使用手机的时间越来越长,依靠手机进行网络社交和休闲娱乐的学生越来越多,大学生手机成瘾现象也越来越常见。本研究采用手机成瘾倾向量表、孤独感

期刊

大学生解释偏向孤独感手机成瘾

来氟米特对实验性兔急性心肌梗死的治疗作用

目的：评价来氟米特对急性心肌梗死（AMI）的治疗作用及其机制，为冠心病防治寻找新药物提供实验依据。方法：将体重1．5～2．5奴的成年兔36只随机分为对照组（A组），来氟米特组（B组）及普伐他汀组（C组

期刊

心肌梗死炎症来氟米特普伐他汀

提取方正排版文件广义元数据并生成全文HTML的探索

其他学术论文