基于规则的网络文本资源标题快速自动识别方法

来源 :2011图书馆信息技术的应用、服务和创新学术研讨会暨第3届数字图书馆与开放源代码软件(DLIB&OSS2011) | 被引量 : 0次 | 上传用户：hq520cyj

【摘要】

：

本文选取网络文本资源的标题识别作为切入点，除考虑多数研究关注的文本的格式信息（如字体）、位置信息等特征外，加入对标题与网页正文内容的相关度的考虑，利用科技监测项目采集到的

【作者】

：

刘建华;张智雄;谢靖;邹益民;

【机构】

：

中国科学院国家科学图书馆,北京,100190

【出处】

：

2011图书馆信息技术的应用、服务和创新学术研讨会暨第3届数字图书馆与开放源代码软件(DLIB&OSS2011)

【发表日期】

：

2011年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文选取网络文本资源的标题识别作为切入点，除考虑多数研究关注的文本的格式信息（如字体）、位置信息等特征外，加入对标题与网页正文内容的相关度的考虑，利用科技监测项目采集到的大量历史数据作为统计分析的基础，从候选标题的可能来源和特征方面，构建了基于规则的网络文本资源标题快速识别方法，并最终给出了该方法的时间效率和识别准确率测评结果。基于识别出的标题，可以进一步推动信息检索、文本聚类、主题监测等后续内容分析工作的开展。

其他文献

“985工程”高校图书馆文献传递服务的调查与研究

文章通过对我国“985工程”高校图书馆文献传递服务工作现状的调查，概述了我国文献传递务工作特点，指出目前文献传递服务中存在的问题，并提出相应的建议。

会议

985工程高校图书馆文献传递服务工作现状工作特点问题文章调查

简论道路桥梁施工技术的重要方法措施

伴随着道路桥梁经济的日益发展，在路桥施工的过程中科学合理的施工技术和质量控制也是提高路桥的使用寿命，提高施工的质量，降低路桥维修成本的重要的措施。在路桥施工管理中，加强

期刊

道路桥梁施工技术

基于Web的药物情报服务平台的设计与实现

网络信息技术的飞速发展极大地改变了图书馆的内外信息环境。中科院上海药物研究所图情室，采用“一个后台面向多个前台”的新型架构和B/S 多层体系、Struts+Spring+Hibernate

会议