海量网络学术文献自动分类系统

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:wangyingygp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展,互联网上的学术文献数量呈指数增长,很难为科研工作者所利用,因此亟需一种方法对海量的网络学术文献进行自动的搜集、整理、分类。在前期充分的实验论证后,设计实现一个海量网络学术文献自动分类系统,该系统使用模块化设计,包括学术文献自动抓取模块、学术文献词-文档矩阵处理模块、本体集成模块以及基于语义驱动的分类模块。实验证明,该系统可以有效地完成海量学术文献的自动抓取、处理和分类工作。 With the development of the Internet, the number of academic documents on the Internet increases exponentially and it is difficult for scientific researchers to make use of it. Therefore, there is an urgent need for a method to automatically collect, sort and classify vast amounts of online academic documents. After a sufficient period of experiment and demonstration, a massive network academic document automatic classification system is designed and implemented. The system uses modular design including academic document automatic retrieval module, academic document word - document matrix processing module, ontology integration module and semantic driven Classification module. Experiments show that this system can effectively accomplish the automatic retrieval, processing and classification of massive academic documents.
其他文献
目的探讨微小RNA?3182(miR?3182)在肝癌细胞凋亡和放射敏感性中的作用及机制。方法实时荧光定量PCR与Western blot检测肝癌细胞系及正常肝细胞中miR?3182、FAM83A的表达;miR?
分析了涵江区的特色林业发展现状和优势以及存在的问题,从科学造林、城乡绿化、林权制度改革等方面提出了特色林业在涵江区城市建设中的运用和发展对策。
在我国,管理会计的理论已逐渐融入到会计的教育教学当中,管理会计作为一项工具在各企业中也得到了实践和应用,但在实际应用中还有相关理论不够完善、相关人才队伍不够专业、
区域经济综合竞争力是指区域内各经济主体在市场竞争过程中逐步形成并表现出来的占有资源和市场竞争能力的总和。本文通过建立区域经济综合竞争力评价指标体系,采取理论研究和
丁肇中认为,搞科学实验要取得优异的成绩,必须对科学实验具有深厚的兴趣,对其重要性有明确的认识,对科学实验不断创新,与此同时,还要对科学实验进行竞争,进行严谨慎微的探索,
目的:探讨依帕司他治疗糖尿病心血管自主神经病变的临床效果。方法:选取52例糖尿病心血管自主神经病变患者,随机分为观察组和对照组,各26例。两组患者均给予常规降糖药物治疗,
《兽药经营质量管理规范》已于2010年1月4日经农业部第1次常务会议审议通过,现予发布,自2010年3月1日起施行。
中国资本市场频发的信息披露违规现象,已成为近年来财会和金融领域的研究热点。利用近年发生的相关案例,界定和阐释了信息披露违规的主要类型,以2009-2013年沪深A股上市公司
以熔模铸造生产的某汽车控制臂支架为载体,研究防流出失效的控制管理方法,主要从本源性工艺改善、检测技术升级、重大风险清单化管理评价、质量责任制推进四个方面进行研究。
本文深入讨论了半波损失,额外程差以及它们的区别和联系,并通过讨论得出了额外程差±λ/2的取值并不影响薄膜干涉问题结果的结论。本文澄清了教学中的一些模糊认识。