科技文献趋势挖掘技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:kingerfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本挖掘是指从文本数据中抽取隐含的、未知的、有价值的知识的过程。文本趋势挖掘是文本挖掘的一个重要分支,旨在发现文本信息中隐含的趋势规律。科技文献趋势挖掘对研究人员具有重要意义,它有助于科研人员把握学科整体结构及发展现状,从而帮助研究人员做出合理科技决策。本文重点研究科技文献趋势挖掘的相关技术及改进方法。   本文对科技文献趋势挖掘技术的现状和发展状况进行了简要的回顾,介绍并比较了几种常用的科技文献趋势挖掘方法。这些方法之中,关题词共现分析法相较科技文献趋势挖掘的其它方法而言具有及时性、客观性等优点,然而也存在着挖掘深度不够、稳定性不高等缺陷。本文研究针对该方法存在的这些缺陷,从技术和结构上进行改进。基于此,论文主要进行了以下研究:   首先,本文提出了多层面趋势挖掘模型。传统的基于关键词共现分析的科技文献挖掘方法主要是以可视化的方式展示某时间段内学科主题整体分布情况,通过对比不同时间段里学科主题的变化笼统地分析学科领域内研究主题的整体发展趋势,缺少对具体研究主题的发展趋势的认识。本文提出的趋势挖掘模型从宏观和微观两个层面分析研究主题的变化趋势,宏观上主要针对研究领域总体态势分析,微观上分析具体科技主题的发展状况。   其次,本文针对该方法精确度不高的缺陷,做出了进一步的改进。结合客户关系管理模式中的RFM模型,论文提出了一种二阶段趋势挖掘模型,用于分析具体科技主题的内部走势。论文从关键词类团组成变化、关键词类团向心度变化等多个方面分析主题的变化趋势,总结出研究主题发展的一般规律。   此外,本文提出从作者、研究机构、被引关系多个维度对科技文献的发展趋势进行判断,从而弥补了传统的关键词共现分析法判断依据过于单一的缺陷。研究发现在科技主题发展的不同阶段,与之对应的作者、研究机构、被引关系呈现不同的特点。   最后,使用中文信息学报语料和中国图象图形学报语料对本文提出的基于关键词共现分析的改进方法进行了实验,并对实验结果进行了比较和分析。实验结果证明了方法的正确性。  
其他文献
数据库系统和信息检索系统在处理数据的方法上有很大的差别,数据库系统通过复杂的查询语言搜索结构化数据,其结果集完整精确;信息检索系统通过关键字搜索非结构化数据,其结果集通
游戏中智能的设计与构建一直是人工智能研究中的热门领域。游戏中,人工智能不仅要模仿人的智能,还需要拥有达到设计者为了满足玩家需求所设定的目的的能力。通过对游戏信息的收
鉴于当前餐饮业面临的物价和人力成本上涨,利润越来越薄,规模难以维持等严峻的市场压力,各种点菜系统开始出现。已有的点菜系统一般由服务员代替顾客完成在点菜机上的操作,忽略了
随着计算机视觉技术和图像处理技术的迅猛发展,视频监控技术在各个领域中的应用越来越广泛。视频监控系统就是利用摄像机等电子设备来捕获视频序列,然后使用计算机视觉技术和图
随着两化融合的快速推进,信息系统逐渐成为国家发展、社会生产以及个人生活中不可或缺的基础设施。信息系统给人类提供巨大便利的同时,面临着黑客、木马、隐通道、社会工程攻
无线设备及业务迅猛增长和频谱资源日趋耗竭的矛盾越来越突出,如何让有限的频谱继续满足人们日益增长的带宽需求成了无线通信领域急需解决的问题。认知无线电技术通过感知并
EOC是以太网信号在同轴电缆上的一种传输技术,由于其无需重新布线,高速的以太网传输能力,较强的抗干扰能力,以及能实现基于IP的各种业务,如高速数据业务,使得其在HFC各方案中
无线传感器网络是一种新型的无基础设施的无线网络,因其广阔的应用前景,引起了国内外学术界和工业界的高度重视,成为目前研究的热点之一。无线传感器网络路由协议是无线传感
入侵检测系统(IDS)已成为网络安全防御体系中的重要组成部分。然而,目前大规模网IDS会实时产生大量琐碎的警报数据,其中普遍存在着冗余的、不正确的警报。这些数量大、质量低
特征选择作为维数约减领域的一个重要分支,对增加机器学习结果的精确度和提高计算效率有着显著的作用。虽然特征选择算法已在监督条件下被广泛研究,然而在非监督条件下,由于