论文元数据信息的自动抽取

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:pacochan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。
其他文献
当前推动我国经济增长的人口红利已达到顶端,新型城镇化将成为中国经济新的增长点。积极稳妥地推进城镇化不仅是扩大内需的重要手段,也是转变经济增长方式的必然途径。本文在
以赣南医学院黄金校区学生为调查对象,对在校学生网络购物现状进行研究。调查结果显示,大学生网络购物主要选择知名网站进行购物,总体消费额比较低,主要以购买服装为主,网络
随着经济社会的发展,对应税所得的确定也有不同的认识。本文分析了以合法所得为前提来确定应税所得的观点有其局限性,认为"应税所得"应确定为:纳税人从各种来源渠道获得的一
政治认同是由政治认知、政治情感、政治意向等心理因素的统合而结成的整体政治心理结构。就静态层面而言,政治认同生成机制的结构因素由利益诱导、政治规训、社会参照构成,利
绘词法作为文艺复兴时期兴起的一种谱曲技法在音乐史上具有重要的意义。绘词法的运用所表现出的音乐现象存在于文艺复兴时期之后的音乐中。绘词法作为一种音乐观念同样具有重
LT中学是一所具有50多年校龄的县域优质中学,在办学规模快速扩大之后遭遇发展瓶颈。在U-S合作中,指导团队形成了"临床诊断,找准问题——对症下药,制订方案——实施改进,过程
强化校本的、过程性的评价结果在高校录取中的作用,是国内外高校人才选拔的一个共同趋势。为了保证校本评价结果的准确性、可比性、公平性及其在招生选拔中的可用性,各国不同
中国软科学的研究,取得了一定的成就,但是专家和学者在研究的很多方面还没有完全达成共识,存在诸多质疑,制约着软科学的发展。围绕软科学研究的概念、研究方法和研究机构等几
在《自然辩证法》一书中,恩格斯剖析了人与自然的矛盾根源在于劳动实践,提出了站在自然看自然、正确认识和运用自然规律、对资本主义生产方式实行完全的变革等人与自然和解思
2010年年初,北京市东城区“两会”传出构建“钟鼓楼·北京时间文化城”的消息。这顿时成为街头巷尾人们热议的话题,并由此在文保界引发了一场“地震”。姑且不说这一项目会使