基于数据挖掘中文书目自动分类算法

来源 :计算机测量与控制 | 被引量 : 0次 | 上传用户:quchaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种改进的数据挖掘算法;首先采用ICTCLAS系统进行文本预处理,以词频特征构建词条向量;然后融合词频特征和词频-逆向文件频率特征,构建训练样本集的特征矩阵;接着对该矩阵进行奇异值分解变换,得到语义空间,用于对文本特征向量进行语义空间变换,得到语义向量;最后构建联合支持向量机分类器,实现中文书目所对应的语义向量的自动分类;最后做了大量的仿真实验,实验结果表明,文章方法的分类准确率高于现有方法。
其他文献
通过文献调研及问卷调查分析 ,研究了我国 2 0 1 0年群众体育发展趋势 ,并提出相应建议。
根据国内有关统计数据,对火电厂污染物的排放进行了计算和分析,根据燃煤煤质特点和排放情况,对各种污染物提出了不同的治理措施和综合利用的方法(包括烟尘、硫化物、氮氧化物
再发性心肌梗塞31例临床分析交通部秦皇岛港口医院内科(066002)洪敏随着冠心病的发病率和急性心肌梗塞存活率的增加,再发性心肌梗塞亦逐渐增多,我院近10年收治急性心肌梗塞264例,其中初发233例,再梗
系统性念珠菌病快速诊断研究新进展中国人民解放军第452医院外二科(610061)邓光平综述第三军医大学西南医院烧伤研究所张雅萍肖光夏审校近年来,随着治疗严重烧、创伤、器官移植、血液病、
海洋天然产物ent-chromazonarol分离于海绵Disidea pallescens,具有抗癌、抗肿瘤活性,是潜在的药物先导化合物。本论文以海洋天然产物ent-chromazonarol等为研究对象,基于合
新生儿窒息并发低钠血症危险因素分析第一军医大学南方医院儿科(510515)张勐,姚英民,吴建春新生儿窒息后常合并稀释性低钠血症,如何早期预测,采取相应的防治措施,是提高新生儿窒息后并发症
近年来,城市化迅速发展过程中对城市空间规模扩大的客观需求,房地产市场近年来的限购政策,以及当前居民消费形态升级,都需要一种混合化、多样化的商业服务形式,这些因素有力
<正>北五味子具有益气敛肺,滋肾涩精,生津止渴,止泻敛汗之功效[1]。北五味子叶味甘,微苦,微涩,性平。据于俊林[2]等人分析,每100 g嫩叶含水分79 g,蛋白质3.9 g,脂肪0.3 g,碳
至于中国车未来成长动力。似乎不需要担心,尽管存在诸多不确定性因素。但依照“爱我中国车”之于自主品牌判断,中国车已进入“花样年华”好时光,接下来是勇敢者之间的较量,请锁定
来自德国政府的一个委员会的报告称,欧宝汽车公司今年第一季度或最晚6月初就将关闭。这是该委员会审查了德国政府有关部对欧宝汽车公司的调查情况以及查看了欧宝公司在德国的