基于粗糙集的Web文本KNN分类方法及在金融中的应用研究

被引量 : 0次 | 上传用户:Liujiajia0801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融市场的全球化发展以及计算机网络技术的广泛应用,全球金融市场已经开始走向金融网络化。与此同时,互联网业已成为企业、机构和个人获取金融信息的主要来源;作为专业金融信息服务提供商或是个人,在面对如此海量、繁杂的互联网金融信息资源时不可避免会遇到一个巨大的挑战,即如何从互联网中实时、快速地分类和处理金融数据,如何提高Web金融数据获取效率和质量,从而改善公司金融信息服务质量,提升公司在金融信息服务行业的核心竞争力,这也成为当今学术界研究的重点问题之一。随着信息技术和通讯技术的发展,自动信息分类技术已经成为人们有效的金融信息分类工具。当今,Web文本分类的中文信息处理是一个重要的研究领域。其目标是分析文本内容的基础上,分配一个文本到更合适的类别,以便提高文本检索应用程序的处理效率。目前有许多方法应用到此技术中去。目前,K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。KNN算法也是文本自动分类领域中的一种常用算法,对于低维度的文本分类,其分类准确率较高。然而在处理大量高维度文本时,传统的KNN算法由于需处理大量训练样本导致样本相似度的计算量增加,降低了分类效率。为解决这个问题,人们利用粗糙集对高维文本信息进行属性约简,删除冗余属性。现在相继有了一些粗糙集和KNN的混合分类方法,主要是在属性约简方面去做研究。虽然效率上比传统的单一的KNN算法在分类效率上有了很大提高,但是仍有很大的改进空间。于此,本文在基于粗糙集和KNN算法的基础上,将给出一种基于粗糙集的KNN分类系统模型和结合金融环境下的分类应用系统。在模型和系统中,我们将引入一种改进型分明矩阵的约简方法来约简属性,并采用一种改进型的CHI和模式聚合方法来处理特征提取阶段,这样使特征向量的个数大大的有效约简,减少分类阶段的数据输入量,从而提高整个分类系统的分类效率,降低分类系统的时间和空间复杂度。在本文中,我们还通过实验结果与分析,说明了这种基于粗糙集的KNN改进的分类算法比目前一般的基于粗糙集的KNN分类算法,在分类效率上有了很大的提高。本文在分析Web文本挖掘与Web文本分类的研究现状和存在问题的基础上,主要研究了Web文本分类关键技术、方法和基于粗糙集和KNN的混合Web文本改进分类算法。本文的主要工作包括一下内容:(1)介绍Web挖掘、Web文本挖掘、Web文本分类、粗糙集的基础理论和相关知识,介绍Web文本分类过程中的关键技术。(2)给出结合粗糙集与KNN的Web文本分类系统模型。(3)给出一种基于粗糙集的分明矩阵改进约简算法。(4)给出一个基于CHI方法的特征提取和模式聚合方法的KNN改进算法。(5)给出金融环境下的Web文本分类系统,及其实验结果与比较分析。
其他文献
最早出现在美术作品上的门神和木工的祖师鲁班有关。古籍中记载说,春秋末期,身为工匠的鲁班为了护门,就模拟螺蛳的形象,制作出了门锁和门环,鲁班制作螺蛳形状的门锁和门环的意思是
报纸
随着教育部多次颁布大学英语教学指导的相关文件,齐齐哈尔医学院开展了以网络为基础,将视、听、说三门课有机地结合起来,探索出视听说三位一体的立体化教学模式-大学英语视听
转录因子(Transcription factor,TF)在调控基因表达的过程中发挥着重要的作用,通过与基因上游特定序列结合,从而影响目的基因的表达时间、表达位置以及表达强度。实际上,多个转录因子之间会形成复杂的组合模式来参与基因的表达调控过程。为了系统的分析转录因子组合与基因的表达水平之间存在的关系,以GM12878(人类B淋巴细胞)作为研究对象,利用两种表达数据得到了基因的表达水平,通过取交集
以高压气体作为介质的高压气动系统,具有功率密度高、瞬间膨胀性大等特点而广泛应用于航空航天、天然气工业等领域。高压自力先导式减压阀作为高压气动系统的关键部件之一,其
<正>尽管监管部门日益表示关切,但中国投资者仍不断地将资金投入高速发展的互联网货币市场基金,推动中国共同基金资产规模创下历史纪录。资产管理咨询公司泽奔咨询(Z-Ben Adv
室温离子液体(Room-temperature Ionic Liquids, RTILs)作为一种新型的绿色溶剂,在有机反应、电解质材料、气体/液体分离等方面具有广泛的应用前景。其中,利用RTILs来实现温
在市场竞争日趋激烈的今天,企业真正需要的人才是具有道德底线和社会责任感的管理人才。只有具有社会公德和遵守社会秩序的营销人才,才能够获得企业的认可和肯定。营销管理者
目的综述板蓝根研究现状及进展。方法对近年来有关板蓝根的化学成分的药理活性研究论文作系统检索,分类综述,总结已得成果,找出存在问题,指出研究方向。结果近年来对板蓝根进
中美两国都是负责任的大国,两国对能源的需求具有相似性,能源市场具有互补性,而两国在新能源领域的技术发展不均衡,因此,中美两国在新能源领域的技术合作具有广阔的应用前景。本文