数字文献资源多元深度聚合研究

来源 :武汉大学 | 被引量 : 7次 | 上传用户:jakieli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书馆是社会文化公共基础设施的重要组成部分之一,在社会文化事业发展中将起到十分重要的积极作用。无论是图书情报学的理论研究还是现实的图书馆事业,均越来越强调实现知识服务的重要性。深化图书馆知识服务能力,提升图书馆知识服务水平已经成为当前亟需解决的问题;此外,随着科学发展所累积的数字文献资源规模越来越庞大,如何高效利用这些数字文献资源也逐渐成为提升知识服务能力的重要研究命题。本文的选题“数字文献资源多元深度聚合研究”正是在这样的大背景下提出来的。本研究综合运用语义挖掘、自然语言处理、信息计量、网络结构分析等多学科交叉的方法,创新地提出数字文献资源多元深度聚合理论是衔接信息计量与信息检索的重要桥梁,并在此基础上构建了数字文献资源多元深度聚合理论体系,从多个方面论述了其多元性特征和深度特性;进一步明确了多元深度聚合的技术流程和方法,通过两类典型的数字文献资源特征项关联网络论证了该方法体系的实用性和可操作性。本研究力求从新的途径来实现数字文献资源语义揭示与深度聚合,改进图书馆服务方式,提升服务效率和水平,为数字图书馆的建设和多学科交叉的方法体系提供有益的探索成果。本文坚持“理论结合实践,用实践验证理论”的思想,从理论基础研究,理论体系研究,核心技术流程,典型聚合方式实证等多角度系统化进行数字文献资源多元深度聚合研究。论文第0章引言论述了选题背景、研究意义、国内外研究现状、技术路线与目标,第六章为研究总结和展望;其余核心部分包括如下五章:第一章是数字文献资源多元深度聚合的理论基础研究,目的在于明确问题来源和理论定位。首先对数字文献资源的概念和构成要素进行分析;进一步阐述了作为聚合前阶段的数字资源整合的主要内容以及与聚合的关联;论述了当前研究中与数字资源聚合最相关的领域-信息检索的基本思想及其与聚合的关联;分析了信息计量学中的集中与离散分布现象,说明这是能够实施聚合的基础,在此基础上将数字文献资源多元深度聚合定位为衔接信息计量学和信息检索的纽带。第二章是数字文献资源多元深度聚合的内涵和理论框架研究。多元深度聚合是用户和以资源集合为表现形式的知识世界的交互过程;数字文献多元深度聚合的理论模型包括聚合的对象类型、关联网络、测度方法和聚合目的等四个要素,这些要素所具有的多元性特征反映了数字文献资源聚合的多元性。从基于元数据的聚合、基于计量的聚合到基于语义的聚合是一个不断深化的过程,其中包含了多粒度的层次,不同对象的聚合重点也是体现聚合深度特性的一个重要内容。理论框架的建立为进一步明确技术流程提供了基础。第三章是数字文献资源多元深度聚合的技术体系研究。首先构建了多元深度聚合的通用流程框架,进一步将之归纳为三个核心技术问题,即聚合对象的重要性评价、资源聚合的获取、资源聚合的语义揭示。对比了局部重要性和全局重要性指标,分析了全局重要性评价的优点。针对基于节点和基于聚类的两类现有方法,创新地提出了相对重要性聚合方法。归纳了从词频,共现再到主题模型的语义发现路径,总结了主题语义挖掘的灵活性和可操作性。第四章是引文网络中核心资源多元深度聚合的实现。引文网络是特征项关联网络中有向-二值网络最典型的代表。本章系统分析了传统引文网络中的重要性评价单一、结构分析粒度过大的问题,并提出改进指标和方法,将多元深度聚合技术流程应用于XML研究论文的引文网络中,发现相对值聚合方法能够揭示网络中最具层次丰富性的核心资源聚合。结合主题语义分析,能够实现聚合中所包含语义内容的深度揭示。基于引文网络的资源深度聚合结果是本文所构建的理论和方法体系有效性的重要体现。第五章是作者知识关联网络多元深度聚合实现。作者关联网络的类型最丰富,明确作者复合关联网络的聚合流程也就解决了其他多种特征项的聚合问题。本章详细描述了作者数据的著录问题和清洗策略,构建了作者合作、互引、共被引、基于文献的耦合、基于关键词的耦合和基于出版物的耦合等六种关联网络,对网络间的关联性进行分析,为各种共现网络分析方法的结合使用提供更多的支持。利用加入作者的语义主题模型挖掘出作者的主题语义分布,发现作者合作网络、共被引网络、基于文献的耦合网络的聚合均有其独特之处,而互引、基于关键词的耦合、基于出版物的耦合则有许多使用上的限制条件。基于作者关联网络的资源深度聚合能够为满足用户知识需求提供更多角度的支持。
其他文献
目的:探讨了COPD患者治疗前后血清BNP·CNP和血浆Fbg·D-D水平的变化及临床意义。方法应用放射免疫分析法和生化法对36例COPD患者进行了治疗前后血清BNP·CNP和
在“中国制造2025”的背景下,我国机械设计制造及其自动化行业要抓住发展机遇,实现经济发展的转型升级。本文阐述了“中国制造2025”规划的基本目标,分析了机械设计制造及自
混沌激光作为激光器输出不稳定性的一种特殊形式,具有类噪声宽频谱的特性。近年来,随着人们对混沌激光特性的掌握和控制,混沌激光应用受到了研究者们的广泛关注。结合国内外
“三品层递”培养创新型首饰设计人才的教学模式,使学生基于三个“看得见,摸得着”的真实项目。本文通过在人才培养模式、课程教学模式和评价模式上的创新,逐层递进式培养学
高血压病治疗应根据患者年龄、血压分级、分层情况、有无并发症、合并症、个体特异性及经济状况,制定灵活的个体化治疗方案,有效控制血压,减少并发症的发生。
目的:研究并分析急性脑梗死合并肺部感染的护理体会。方法在我院随机选取200例急性脑梗死的患者,其中有60例患者急性脑梗死合并肺部感染,对其实施有效的整体护理干预,观察其
目的探讨格林巴利综合征(GBS)早期神经电生理改变特点。方法回顾性分析我院50例确诊为GBS患者发病2周内神经电生理检测结果。结果 20例(40%)患者运动神经传导速度(MCV)异常,15例(30%
建筑工程项目中涉及到的问题都是较为严谨的,因为这会涉及到最终项目建成后的安全问题。首先有关于深基坑的概念是指开挖深度超过5m或者地下室三层以上,或者是深度虽然没有超
高校治理法治化是建立现代大学制度的法治保障,是完善大学内部治理结构的现实要求,是实现大学治理现代化的重要举措。推动高校治理现代化,必须形成以权责明晰为关键的法治思
目的:研究缺血性脑白质病治疗方法以及效果。方法选取本院4年来的200例脑白质患者,对其进行随机分组分为对照组和实验组,100例/组,对照组未经正规治疗,实验组经过本院的正规