基于分类法自动映射的众包实现

来源 :山西大学 | 被引量 : 0次 | 上传用户:stevewen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类法作为重要的知识组织工具,在图书馆书目资源、文献资源按类组织、分类排架以及多种网络信息资源的导航和检索等方面发挥着重要作用。目前,不同国家地区,不同性质的机构采用不同的分类法标引各自的信息资源,不同分类系统之间未明确建立对应关系,从而影响了互访效率。随着图书馆之间馆际互借及其资源共享运动的推动,图书馆书目数据库之间的互访成为发展趋势。建立不同词表之间的映射是实现分类系统互操作的一种重要方法,对不同分类法之间的映射研究具有重要意义。目前,国内外学术界针对分类法的映射做了积极地探索和实践,分类法映射模式分为人工映射和自动映射。人工映射的映射结果准确、完整,但是工作量大、完成周期长;自动映射提高了映射效率,仍存在结果不准确、有些类目无法建立映射等问题,无法实现完全自动映射。结合人工映射和自动映射的方式可以有效提高分类法映射的准确率和效率。众包是一种创新模式,利用计算机和用户的经验及知识来解决机器难以单独完成的任务。将众包引入分类法的映射实践,其实质是利用大众的知识背景和智慧完成映射工作,可以提高映射的准确性并发现更多的映射类目。基于以上背景,本文提出基于分类法自动映射的众包实现方法,依据分类法特点构建自动映射模型,在自动映射结果的基础上,通过设计众包映射组织模式,最终实现分类法之间的匹配。本文首先对分类法映射基础理论、映射方法进行简要概述。选择CLC、DDC、LCC这三部世界范围内使用广泛的图书分类法,构建CLC与DDC、LCC两种国外分类法之间的映射。本文分析了三种分类法各自的特点,采用基于类目相似度的方法实现CLC与DDC类号映射,映射过程中对类目特征词进行词素切分。在CLC与LCC映射中,引入DDC与LCC的映射,提出基于关联书目数据的DDC与LCC映射实现,并且以DDC类表为中介,间接建立CLC与LCC之间部分类目的映射关系。之后以自动映射的结果为基础,通过设计众包分类法映射框架、众包映射任务模块、众包映射质量控制方案等构建众包分类法映射模式。最后,通过具体的应用实例验证该方法的准确性和有效性,为其他分类法的映射提供参考。
其他文献
江南地区是近代工业化发展较迅速的地区,并形成了一定规模的农民务工潮和一个初步的、有一定层级的劳动力市场。本文通过分析30-40年代农家抽样调查的资料,发现江南地区农户职业结构发生了一定的变化,“男耕女工”的劳动力使用方式成为一种新现象,但并不意味着农户脱离了家庭和农业生产,它只是农村劳动力转移的一个过渡性特征,笔者概括为区域工业化下的“新耕织结构”。笔者重点分析了这种新耕织结构的产生原因和内在机理
《义务教育音乐课程标准(2011版)》明确指出:“人文性,审美性,实践性”作为课程的性质,广大教育工作者为把学生培养成新时代背景下全面发展的社会主义建设者和接班人而努力。初中音乐教材中感受与欣赏部分的内容占据了相对较大的部分,这也说明初中音乐欣赏课在教学中有着极重要的作用,但在实践过程中发现初中音乐欣赏课堂教学中却存在着教学效果不佳的实际问题。为解决该问题笔者从教学设计作为切入点,有效的教学设计是
学位
造成商业银行信用风险有诸多因素,本文主要从企业杠杆率方面入手。基于对商业银行信用风险的分析,使得本文在研究企业杠杆率水平有了一个微观基础,企业杠杆率的高低是一个领
我國圖書目錄分類歷史極其久遠,一書目錄遠可追溯至先秦——據余嘉錫先生意見,《目寺》、《書》序言已經是目錄的萌芽。《序卦》名為按順序對《周易》各卦進行概括說明,其實可以極端地將之看作《周易》的目錄。即便此說仍有爭論,後世公認的目錄開山之作,劉向編著的《七略》,業已距今二千餘年了。洎劉向之後,世所共勉,目錄著作推陳出新,綜合性目錄、史志目錄歷代夥集,學科目錄涵蓋經、史、子、集,特種目錄種類繁多,不一而
“问渠哪得清如许,为有源头活水来”。创新自古以来就是中华民族的优良传统。在我国“五年规划”迎来第十三个实现期的历史机遇时刻,国家经济转型、企业创新改革的呼声也日益
随着无线传感网络(Wireless sensor networks,WSNs)、自动控制系统、植入式电源系统等应用系统的快速发展,它们对电源管理系统性能要求也越来越高。传统电源管理系统的控制环
机构是指拥有共同目标的社会实体。作为信息资源的发布者,科研评价的统计单位,信息检索的重要字段,知识导航的代表性要素,机构实体在信息组织方面发挥着重要的作用。机构实体数量繁多,层次关系复杂,名称形式各异,衍化多样。在关联数据的蓬勃发展的背景下,不同来源的机构实体的组织方式不一,揭示粒度有别,方向各有侧重,展示形式各异,范围多有重叠。加剧了数据之间的异构性和分散程度,使得辨析机构的唯一性成为棘手的难题
目的:研究中轴骨及骨盆软骨肉瘤的独立预后因素,开发可预测中轴骨及骨盆软骨肉瘤患者5年和10年总体生存率的列线图。方法:回顾性地从监测,流行病学及最终结果数据库(SEER数据
研究背景白癜风(vitiligo)是一种临床常见的色素脱失性疾病,临床上主要表现为边界较为清晰的白色斑片,不同年龄和不用性别均可发生。皮损可发生于任何部位,尤其以暴露部位、
自由视角电视是一种可以让用户自由选择视频视角的新型电视,这种电视给观众带来了身临其境般的观看体验。为了提供高质量的用户体验,自由视角电视视频流传输需要巨大的带宽和严格时延限制。为了允许用户自由选择视角,网络需要同时为用户提供多个视角的视频流,视频速率需要至少1.6Gbps;同时为了保证用户改变视角时不发生眩晕感,时延要求不高于1Oms。针对上述挑战,本文首先根据用户视角的分布,提出了适用于自由视角