基于循环迭代算法改进的TFIDF方法及应用

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:zhuqs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类是指自动地将文本集合分组为不同的类别,应用非常广泛.研究发现,传统的TFIDF文本分类方法存在很多的不足,针对这些不足提出改进.通过使用循环迭代算法根据特征词在类内和类间的分布情况不断优化特征词的选取,获得不断改进的分类.采用支持向量机分类器对文本分类.通过对大批量的数据集测试,该算法显示出较好的特征选择效果,能够有效地提高分类精度.
其他文献
针对认知无线电系统中主次用户频谱共享问题,提出了一种基于逢低买入的频谱分配机制。本机制在传统的拍卖中引入了次用户的合作关系,建立了相应的基于逢低买入的合作竞拍分配模
期刊
近年来,随着港口码头的兴建、沿海旅游事业的发展及海洋功能区划的调整,对海洋的利用不断深入。沿海城市越来越多的收回海域使用权来满足社会经济发展的需要,因公益收回海域
针对预重传GBN-ARQ方案在误码率低的情况下吞吐率与时延大大下降的问题,结合重传编码合并技术,提出了一种基于TDD上行CSI的自适应预重传GBN-HARQ方案。首先,发送端将数据进行前
侵害人的环境侵权行为与受害人的损害结果之间的因果关系证明问题一直是环境污染侵权行为成立与否的关键问题。《侵权责任法》及之前的法律明确规定了因果关系举证责任倒置规则。因果关系举证责任倒置规则将因果关系的证明责任完全分配给了被告。该规则虽然减轻了原告的证明责任,但却过度加重了被告的证明责任,该规则忽略了基础事实与推定事实之间的常态联系,同时在司法审判适用中也存在严重的弱化现象。为了解决该规则的逻辑缺陷
期刊
近几年,卡巴斯基实验室全球研究与分析团队分析了许多全球最大规模的高级持续性攻击(APT)行动,包括RedOctober、Flame、NetTraveler、Miniduke、Epic Turla 以及Careto/Mask等。
针对随机网络编码重传的缺陷,将Fourier矩阵和随机网络编码相结合,提出一种半固定编码系数的广播重传方案FMWBR。利用广播源节点和接收节点双方已知的Fourier矩阵的行向量作为
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
菲律宾籍家庭佣工(一般称“菲佣”)这一特殊群体,数十年前先是出现在发达国家或地区(港澳台),近十年来才在中国大陆形成一股小气候。大量菲律宾女性出国务工,既充实了接收国