稿件分类决策支持系统的分析与设计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:h_f_m
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与通讯技术的飞速发展,信息量呈指数式增长,这使得稿件数量极度膨胀,研究领域不断细化,造成稿件分类的周期延长,论文评审速度减慢,效率降低。同时,缩短稿件评审周期、加快其处理流程已成为新时代期刊杂志发展的趋势。对此,本文研究稿件分类工作,将其智能化,设计稿件分类决策支持系统,提高稿件分类的效率,这对加快稿件评审工作,促进期刊杂志业的发展具有重要意义。本文首先论述决策支持系统的概念、特点、功能及体系结构,文本分类的处理流程及常用算法,并阐述了多分类器融合的组合方式及融合算法。然后,对稿件分类决策支持系统进行需求分析,设计系统的流程及架构体系—三部件结构,即数据库、模型库及人机接口。根据稿件分类的决策流程,设计的模型库主要包括预处理模型库、基于向量空间模型的文本表示模型库、基于文档频度模型的特征值提取模型库、单分类器模型库、分层技术及保持法测试模型,分类结果评估模型,其中单分类器模型库包含朴素贝叶斯分类模型、KNN分类模型、中心向量比较分类模型,并对KNN分类模型进行了改进设计。针对不同单分类器模型可能存在分类结果不一致的问题,根据模型的输出具有可度量性的特点,将群决策理论运用于多分类器融合中,采用混合组合方式,运用投票表决体制和社会选择函数设计多分类器融合模型,解决单分类器模型之间的矛盾。根据各类模型的设计,建立模型库的文件库和字典库,设计模型库管理系统,实现对模型库的有效管理。最后,利用C#语言,.NET框架开发实现系统的数据库和模型库。在单分类器模型开发过程中,针对朴素贝叶斯分类模型的输出问题进行修正。本文从管理科学与工程国际会议上收集已分好类别的955篇稿件,用于测试系统的可行性和实用性,并着重分析各分类器及多分类器融合模型的性能。实验结果表明,当训练集量大时,系统的分类效果较好;同一的训练集下,文本预处理方式对分类效果影响不大;改进的KNN模型明显提高了分类精度,而该算法中,K值的选取并不是越大,分类效果越优;就各分类器的分类效果而言,朴素贝叶斯模型较优,而本文提出的基于群决策理论的多分类器融合算法实现简单,且有效地提高了分类精度。
其他文献
范围副词作为现代汉语副词的一个重要次类,一直是语言学家们关注的对象。在现代汉语中,副词“一律”出现频率高,应用范围广,但常常与其它近义副词混淆。本文将重点考察范围副词“
本文通过对法语专业学生动词学习现状进行考察分析,结合法国语言学家吕西安·泰尼埃尔(Lucien Tesnière)提出的“动词配价理论”,以期能够在基于传统语法的法语教学的基础上,提出
本文研究了基于效率、特别是聚合效率的产业分析技术,主要涉及产业效率及其变化的测度和应用技术、产业效率影响因素的判断技术、产业内部结构的分析技术等。本研究的目的是
西班牙语陈述式简单过去完成时与过去未完成时是西班牙语中一组需要进行分辨使用的重要的过去时时态。本文利用交际语法有关知识重点研究两个时态的区别,对其用法进行辨析,并结
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
期刊
当前形势下,素质教育已经成为时代发展的主流教学模式,而思想道德教育就是素质教育的核心内容。德育的灌输及心理疏导是每一个大学生辅导员所要做的基本任务。大学生是一个复杂
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
当前,产业集群现象在区域经济体系中表现出非凡的活力,已成为各学科领域研究的热点。作为产业集群理论体系的重要构成模块之一的产业集群竞争力,引起国内外的许多学者的关注,形成
学位