基于标引经验和机器学习相结合的多层自动分类

来源 :情报学报 | 被引量 : 0次 | 上传用户:ernie_dun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于《中国图书馆分类法》类目数目庞大且各类目上文献分布不均衡,导致基于机器统计学习的自动分类技术在这种多层分类体系上力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词申对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过将两种分类技术相结合的方法对信息资源进行分类,提出了用相关度来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以
其他文献
系统分析了西安大都市休闲空间的发展现状及存在问题、休闲空间发展演变的动力机制、演变规律,并提出了西安大都市休闲空间发展的适宜模式、空间优化整合方法与措施。从而为
温有奎、徐国华等同志近年来发表的一系列有关知识标引研究的论文,提出了许多新概念、新观点。最近又见到的《知识元挖掘》一书,是温有奎、徐国华等同志在以往论文梳理和提炼的
据Wind数据显示,截至A股5月30日收市,深股通已用额度17.09亿元,当日剩余额度502.91亿元,占比96.71%。截至30日收盘,港股通已用额度4.12亿元,当日剩余额度415.88亿元,占比99.02%。从成交额来
南方日报讯(记者/达海军)昨日,记者从清远市华清循环经济产业园区循环经济标准化试点工作领导小组会议获悉,该园区循环经济标准化试点工作进展顺利并取得阶段性成果。目前,园
报纸
2016年6月,东方雨虹(002271)的股价在14元至17元之间,当时笔者的建仓成本是16.5元。2017年7月初,笔者卖掉的均价是36.5元。2018年7月的今天,股价已经跌破笔者两年前的买入价。两年时
近日,江苏丰山集团股份有限公司(以下简称“丰山集团”)披露招股说明书,公司拟在上交所公开发行不超过2000万股,计划募集资金5.75亿元,投向年产1500万吨硝磺草酮原药生产线技改等四
本文叙述了使用四孔氧枪易产生前列喷溅的现象及其原因,根据实践经验认为,通过减少矿石量,分批加入矿石及采用与萤石,石灰加入相配合,适当地扩大栓位波动范围等措施,可取得减少前期
<正>循证护理是20世纪90年代受循证医学影响产生的护理理念,Meta分析可为临床提供循证护理决策。音乐疗法是应用音乐这一特殊艺术手段,将其优美协调的旋律、音调和
会议
党的十八大以来,山西省委、省政府坚持和发展中国特色社会主义宗教理论,全面贯彻党的宗教信仰自由政策,依法管理宗教事务,积极引导宗教与社会主义社会相适应,开创了山西省宗
A股当前呈现出反复震荡筑底状态,没有赚钱效应,沪深两市每天的成交量处在近4年的低位,与此同时,每周发行2家左右的新股以及证券印花税、券商佣金还在不断地抽血。而市场重要