数字图书馆多种类型文献混合自动分类研究

来源 :图书馆杂志 | 被引量 : 0次 | 上传用户:lwk2293366
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探索数字图书馆的图书、期刊、网页等不同类型的馆藏文献进行分类组织时,多种类型文献单独及混合自动分类的特点。采用KNN等分类算法对多种类型文献进行分类实验并分析比较。仿真实验表明:随着实验文本数增加,各种类型文献的单独自动分类准确率有2%至7.8%不等的提升。图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达到85%以上;对多种类型文献实现基于自动分类的统一组织具有较高的可行性。 Explore the digital library books, periodicals, web pages and other types of collections of documents classified organization, a variety of types of documents alone and mixed automatic classification characteristics. Using KNN classification algorithm to classify different types of literature experiments and analysis. The simulation results show that with the increase of the number of experimental texts, the accuracy of individual automatic classification of various types of documents increases from 2% to 7.8%. The hybrid classification between books and academic journals, web pages and non-academic journals is better, and the classification accuracy rate can reach above 85%. It is feasible to realize the unified organization based on automatic classification for many types of documents.
其他文献
仪式是民族村寨文化构建的核心组成部分。论文以中越金平县太平村哈尼族的调查为基础,从仪式与村寨时空、仪式与宗教信仰、仪式与生态文化几个方面,阐述了仪式对于哈尼族村寨
幼儿的阅读兴趣和阅读习惯是幼儿阅读能力提高的关键,针对小班幼儿的阅读现状进行分析,采取相应的措施,激发小班幼儿的阅读兴趣,培养良好的阅读习惯,帮助他们掌握阅读的方法
广东经济总量GDP长期位于全国前三甲,常住人口和流动人口众多,珠三角也是全国经济发展的带动者,能很快接收来自港澳台和欧美的消费趋势,并能影响到东南亚的消费潮流,这里也是
随着煤、石油、天然气等石化能源的日益枯竭,可再生能源的开发与利用越来越受到高度重视。本文对我国的生物质能现状进行了分析,生物质能源蕴含非常丰富;生物质能的发电技术
21世纪初,日本政府出台了具有里程碑意义的《文化艺术振兴基本法》,并先后三次公布《关于文化艺术振兴的基本方针》,确立振兴文化艺术的基本理念,制定振兴文化艺术的政策措施
本文中基于车辆动力传动系统4自由度动力学模型,利用特征值灵敏度分析,获得影响各阶固有振动的关键转动惯量,确定共振频带附近激励时所需动力吸振器的安装位置。根据外部激励
为了研究水生植物在不同的生长期对湿地沉积物中有机质(OM)、氮(TN)、磷(TP)含量变化的影响,以石佛寺人工湿地为研究背景,连续3年(2013-2015年)采集4种水生植物(荷花、蒲草、芦苇、沉
目的:建立定量检测慢性粒细胞白血病(CML)患者bcr-abl mRNA的方法;探讨定量检测CML微小残留病变(minimal residual disease,MRD)的临床意义。方法:采用实时定量逆转录聚合酶
伴随着计算机硬件技术的不断更新,在互联网技术迅猛发展的背景之下,计算机功能更加多样化,满足人们在生活、工作等方面的需求,特别是在资料储存方面,人们提出了较高的要求,硬
随着我国经济发展和煤炭行业的现代化进程推进,保障煤矿安全生产已经成为当下煤矿企业和国家相关部门的重难点问题.这是因为煤矿事故长期都是工伤中伤亡人数最多、损失最为巨