热点主题的探测系统研究及技术实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:chuanqi111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今信息化如此发达,网络中的文献发表和获取显得方便快捷,文献大量发表导致其形成爆炸式增长,在众多文献中必会存在潜在信息。也许有许多科研工作者或意欲投身于科研的人想从文献中了解哪些课题是研究热点、哪些研究领域存在可参考价值等等。为此从文献资料中挖掘出相关领域的研究热点是有必要的。本文就热点主题探测系统做了深入研究,提出了一套对各领域研究热点的探测方法。基本思路是:以网络中发表的学术会议文章为资源,通过数据预处理,利用引文构建出会议同被引用矩阵,并对矩阵处理得到元矩阵,然后使用会议聚类算法进行领域主题识别,形成会议聚类族。然后对每一个会议类中涉及的文章进行文本聚类形成文本聚类族,并与主题结合形成主题集库。接着给主题定义主题频度、主题被引用频度、主题影响因子3个属性,并根据定义好的属性表达式计算属性值。综合考虑属性值和趋势值计算公式计算主题热度值,并通过主题趋势检索和客户端与服务器之间的数据交互,将数据绘制成曲线显示出来。最后,通过4种测试方式对系统性能进行测试,结果表明本系统给出的主题趋势是合理且行之有效的。经过测试,本系统能对各学科多领域的研究主题给出合理的发展趋势,并对它们的研究热点进行探测最后以图像化的方式呈现出来。用户通过输入关键词,系统会执行趋势检索,快速地将关键词映射到对应的主题,并给出该主题一定年限中文献分布情况、作者分布以及趋势值分布。用户可以直观的了解这些信息,并作为参考,对以后研究领域的方向有一定的认识。
其他文献
随着互联网的普及和发展,网络作为继传统媒体之后的第四媒体,其影响已经全面而深刻地渗入到了人们的政治、经济、文化生活等各个方面。网络传播具有自由性、交互性、开放性、虚
在组播安全问题中,组播密钥管理是关注热点,协同的密钥生成需要较大的计算量,为避免给密钥生成给节点带来的负载过大而影响网络性能,需要一个高效而计算量较低的密钥生成方案。尤
IP存储区域网(IP-SAN)是存储领域的一项重要技术,它同时具备IP网络的优势以及SAN架构的强大功能和扩展性。iSCSI协议是IP-SAN中实现存储设备访问的重要协议标准。以iSCSI协议
聚类分析旨在把数据对象划分为几个有意义的子集,也称类簇,以致于同一个类簇里的数据对象相似,不同类簇之间的数据对象不相似。而高维数据的聚类问题已经成为数据挖掘和机器
随着网络技术和信息门户技术的发展,门户中各种应用系统不断增加,用户如果要访问多个系统,不仅要面对多个登录界面,可能还要记忆不同的用户名和口令。每个系统有各自的账号管理系
由于个人计算机和互联网的普及,企业计算机网络上的信息系统种类越来越多,支撑这些信息系统的系统资源也越来越多,如何有效的管理系统资源成为系统管理中的研究热点。目前对
SOA作为当前软件业内的重要思想,正在成为软件行业构建系统和解决实际问题的发展方向。但如何以规范的方式实现SOA思想,长久以来一直是业内争论的焦点,在这期间出现了一些用
随着信息技术的深入发展,越来越多的不同种类的设备包括传感器、手机、甚至花草植物等都可以连接在一起形成一个具有数以万计结点的大规模物联网,因此越来越多基于物联网的应用
传统冯·诺依曼体系结构中,计算资源与存储资源(包括物理存储设备及保存在其上的系统数据和用户数据等)静态绑定在一起,这种相对独立的状态一方面严重影响了计算实体内部资源
随着软件规模的不断扩大,软件发生错误的可能性也增大,如何保证软件的质量和可靠性成为人们非常重视的问题。软件测试是保证软件质量和可靠性的必要手段,软件测试研究领域的