模糊聚类在自动判别专家知识领域中的应用研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:kuba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专家信息的挖掘对建立全国性的专家信息服务平台尤为重要。论文通过对专家所发表的论文,承担的课题等非结构化数据进行挖掘,来自动判别出专家的知识领域。论文在研究分析中文文本预处理的基础上,结合中文文本挖掘过程,研究文本挖掘框架的层次性,建立了专家知识领域自动判别系统的框架结构,并设计出框架结构中各个模块的接口,重点研究了模糊聚类算法。为了能准确地判断出训练集的最佳聚类数,本文通过深入分析多种聚类有效性评价指标函数的“紧凑度”和“分离度”,综合这些有效性函数的优点,对模糊聚类的线性有效性指标函数进行改进,使紧凑度和分离度更加明显。此外,由于文本数据维数高且零值多,相异性不明显,聚类效果不好,论文分析模糊属性均值算法和核技术,把核方法用于模糊属性均值算法中,给出了基于核的模糊属性均值算法。在标准数据中进行实验,表明改进后的指标函数能更加稳定的判断出最佳聚类数,改进后的模糊属性均值算法的准确率和抗噪能力得到提高。并把改进后的指标函数和改进后的算法应用于专家知识领域自动判别系统框架的聚类模块中,提高了文本聚类的查准率和查全率。
其他文献
任意波形发生器(Arbitrary Waveform Generator)是一种常用的信号源,广泛用于科学研究、生产实践和教学实践等领域。随着微电子和计算机技术的蓬勃发展,人们对任意波形发生器的
为了进一步推进基础教育课程改革,南通市教育局将2014年课程改革的重点放在了课堂教学改革上,对课堂提出三点基本要求:“限时讲授、合作学习、踊跃展示”。为此,今年5月中旬在我
随着计算机技术在化学中的广泛应用,各种计算化学应用软件、仪器设备及相关数据等资源的大量涌现使得化学研究愈来愈依靠网格技术。因此,借助当前计算机网格技术,建立计算化学网
据《韩国经济新闻》报道。经过历时10年的精确勘测和分析,在韩国庆尚南道河山郡和山清郡的发长岩地层中发现一个前景储量达20亿t的大型钛矿床,矿脉宽70m、长15000m、深8000m。
期刊
念安全经近几年来,兖州矿业集团唐村实业公司积极探索和拓宽安全教育的新路子。由兖州矿业集团公司鲍店矿工会编写的、全国煤炭系统第一部《煤矿安全三字经》问世后,这个公司马
辽宁省加大力度整顿矿业秩序辽宁省对“三小”矿山即小煤矿、小采石场、小黄金选冶点进行专项治理整顿,取得了阶段性成果,矿业秩序明显好转。辽宁是矿产资源大省,在一些地区存在
在DNA序列分析中计算机预测真核基因的启动子是最具挑战性的问题之一。由于转录是基因表达的第一步,对转录的调控必然成为表达调控的重要形式,而启动子是决定转录起始点和转
随着应用需求的发展,传统上简单的客户机/服务器架构的两层计算模式已经逐渐不能满足企业级系统应用的发展要求。面向事务处理的大规模数据处理和计算已经逐渐要求软件体系结
随着网络技术,数字多媒体技术的高速发展,各类的信息迅速增长,人们接触到大量的图像信息,导致人们对图像检索的要求越来越迫切。传统的基于文本的图像检索已经不能适应环境的
周期性带容量限制弧路径问题(Periodic Capacitated Arc Routing Problem: PCARP)是当前路径优化系统中比较常见的问题,并且有着很强的应用背景,城市垃圾回收就是其最典型的