论文元数据信息的自动抽取

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:w66827552
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者,摘要和关键宇等元数据信息,在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。
其他文献
本研究应用HACCP理论。通过对速冻山药(块)加工过程中细菌污染因素的调查与评估,确定了该加工过程中细菌污染的关键控制点和临界值,并制定了有效的监控办法和纠偏措施,建立了
【正】徐州人民商场第三期综合商业楼是我院承担设计的工程项目.该工程地面以上九层,局部十一层,地下二层,是商业、库房、办公综合性商业大楼.建筑面积14026m~2.综合商业楼工
CORBA是有关用于简化分布式应用与服务软件开发的对象请求中介的一个中间件标准。该文主要讨论了基于CORBA的对象请求中介的两个方向。首先,论述了常规CORBA实现中有关性能优
物理网络拓扑从第二层反映出交换机之间的连接关系,它在网络管理系统中具有重要的地位。文章通过对交换机端口流量的分析,提出在交换式以太网中利用端口流量进行物理网络拓扑发
本文在分析四川内遂高速公路K83+175-K83+263段路堤存在的地质病害原因的基础上,提出了相应的加固处理措施和主要施工质量控制措施,为同类型工程的设计和施工提供了参考依据。
【正】写在前面:作为一个知识分子,其存在的价值就在于指出现实存在的不协调性;作为一个普通的教员,指出我们系面临的形势与挑战,我认为是自己的责任.因为我也站在同一条“船
现在远程教育正在飞速发展,互联网上的网络课件越来越多,为了便一教师的和学生在互联网上找到合适的课件,各种研究机构已经出一些搜索技术,但是这些搜索技术还有很多不足之处,搜索
为了制订《毕节高寒山区猪饲养标准》,丰富动物营养学内容,同时为高寒山区优质猪资源的开发利用和产业化发展提供科学依据,选择8周龄,体重(19.49±1.94)kg的毕节内二元(可乐
本文介绍了脱硫废水处理的传统方法,总结了这种处理方法的优缺点,着重介绍了一种新型高效絮凝剂的作用原理和处理工艺流程以及这种高效絮凝剂,在徐州华润电力有限公司脱硫废
实测资料以及航道整治经验表明,对于给定的维护航深,长江中游河道存在一个临界河宽,当实际河宽小于临界河宽时,实际航深大于维护航深,航道条件较好,否则航道条件较差,这个临界河宽称