基于标引经验和机器学习相结合的多层自动分类

来源 :中国索引 | 被引量 : 0次 | 上传用户:ylzhou40
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建
其他文献
有诗云:床前明月光,疑是地上霜。举头望明月,低头思故乡——李白。农历八月十五日,是中国传统的中秋佳节。在人们眼中,中秋节一直都是仅次于春节的重要节日,摆宴赏月,全家团聚在一起
俗话说,人是铁,饭是钢,一顿不吃饿得慌,两顿不吃腿打晃。为什么人在饥饿时腿会发软,甚至会出现头晕、心慌、出虚汗的现象呢?这主要是因为人体血液里缺少了葡萄糖。据生理学家
期刊
7月22日,澳大利亚媒体ABC的FourCor—ners节目报道了从中国进口的2,4.D农药中含有剧毒致癌物质二嗯英,并指出澳大利亚农药和兽药管理局(APVMA)未对进口此种化学品采取足够的检测和
中国索引学会名誉理事、旅美学者曾蕾以及张甲、秦健一行,应邀于2004年12月13日上午九时在复旦大学图书馆做学术报告。中国索引学会理事长、复旦大学副校长徐忠教授亲切会见并
全球金融危机和欧洲主权债务危机后,多国采用了量化宽松货币政策来刺激国内经济。2012年末至2013年初,美国和日本等国又开始了新一轮的量化宽松货币政策。这种非常规的货币政
农作物病虫测报是植保工作的重要内容,是适期防治、综合防控、科学安全用用药的前提和基础.也是保障农产品质量安全和生态环境安全,促进农民增收的一项重要措施。农作物病虫测报
目的分析冠心病合并2型糖尿病患者的临床特征。方法116例冠心病患者,合并2型糖尿病患者57例为糖尿病组,不伴糖尿病患者59例为非糖尿病组,比较二组患者临床表现、血脂水平、冠
据统计,2012年11月,印度中央杀虫剂理事会及注册委员会(CIBRC)共准予24种农药原药登记。从产品类型看,这24种农药中。有8种为除草剂,10种为杀虫剂,6种为杀菌剂。从登记类型看,有8种农
文章主要讨论了两种层面的“好事者”角色,一是史料层面的,即历史上真实存在的人物,主要把他们放在艺术作品生产-消费这样一个大环节中来考察;一是作者虚构出来的故事中的人
通过对ISO2788-1986、GB13190-1991以及ANSI/NISO Z39.19-2005三部词表编制标准中宏观结构部分内容的比较分析研究,可知叙词表的宏观结构显示方式在不断完善。概念图、本体显