学术期刊网络化运行与管理中的数据挖掘方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wf3281124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展以及数据库管理系统的广泛应用,越来越多的数据被存储起来,如何在这些海量的数据中寻找真正所需要的知识显得尤为重要。数据挖掘作为一个多学科的交叉学科,能够在海量数据中发现有用的模式和规则,是将数据转化为知识的重要手段。数据挖掘技术虽然渗透到了社会的各个方面,但在学术期刊上应用却比较少。论文以“期刊网络化综合运行管理平台”为应用背景,针对该平台已有的业务数据,基于业务数掘库与主题数据仓库,采用数据挖掘方法对有关期刊运行效率与管理质量中的问题进行了研究,并将研究的结果形成新的质量管理规则,运用到学术期刊在线运行管理中。   首先,研究了学术不端行为的检测方法,设计出了一种基于字符串匹配的文本复制检测算法。通过抽取各期刊论文的特征,建立稿件信息数据仓库,运用设计的检测方法,先对数据仓库中的论文进行研究方向和关键字的筛选,缩小比对范围,然后再利用KMP算法对论文的摘要进行详细检查,把相同的文字显示出来,为工作人员尽快准确判别和发现学术不端行为提供了一种有效方法。   其次,对投审稿信息进行了挖掘方法研究,依据统计分析法对稿源信息进行了统计挖掘分析,同时,提出了一种审稿专家的聚类分析方法。前者为工作人员从研究方向,基金类型等各个方面来了解稿源情况提供了依据,后者,则为工作人员构建审稿专家库和合理送审提供了依据。   最后,针对期刊运行与管理系统中日志文件的特点,基于数据仓库技术,对系统日志进行了统计挖掘分析,为期刊的日常运行和维护提供了科学的分析方法和分析依据。   通过对上述数据挖掘方法在期刊运行与管理系统中的研究和实现,为期刊的管理提供了一套辅助分析方法,为提高刊物的办刊质量和办刊效率,减少工作人员的工作量创造了条件,对学术期刊的高质量的健康发展和高效稳定运行具有重要的理论和实践意义。
其他文献
预测网络业务的行为在通信网络的接入管理和拥塞控制等方面有着重要的意义。随着现代通信技术的高速发展,网络规模不断扩大,网络业务呈现多样性。越加复杂的网络行为特征给网
中国下一代无线广播(NGB-W)系统旨在向大量用户提供高速、无处不在、安全的广播服务和三重播放服务。在广播系统中使用低密度奇偶校验(LDPC)码有利于保证其数据和信令传输的
第四代(4G)移动通信技术的发展趋势是移动终端的多样化。这些终端能够支持先进的多媒体服务,以及实现各种空中接口标准的全球兼容。为了实现终端间的互连互通和无缝通信,本文
随着小学教育改革的不断深化,在小学数学教学中就要不断地转变模式,以满足小学生的数学知识需求.数学运算教学是小学数学的主要教育内容,面对小学生数学运算中所存在的问题,
随着移动通信技术的迅速发展,人们希望网络能提供更高的数据带宽,更丰富的业务类型,更多样化的接入方式。3G网络能很好的满足以上需求。但是目前TD-SCDMA布网还不全面,在网络建设
微机电系统和数字电子技术的快速发展孕育了无线传感器网络这项先进技术。无线传感器网络作为一种由大量结构简单、廉价、低功耗的传感器集成无线通信接口所组成的网络,它在
随着微弱信号检测理论与应用的发展,人们把目光转向非线性科学。基于非线性系统的信号检测技术是近二十年才发展起来的一类微弱信号处理新方法。非线性检测方法具有重要的理论
异构无线网络中的负载均衡技术作为联合无线资源管理技术之一,主要解决异构无线网络之间的容量差异及业务分布的不均问题。高效的负载均衡算法有助于增加网络容量、平衡业务负
协同通信是下一代网络中的核心技术之一,中继可以在空闲时刻帮助转发信息,从而提升通信质量,但是中继的转发会持续消耗自身电量,造成寿命降低。射频能量采集技术允许中继从射
能量受限无线网络,例如传感网络,是典型的通过电池来供电,只有有限的使用寿命。尽管通过更换电池或充电能在一定范围内延长其使用时间,但通常这是高成本并且不便利的,在某些