融合LSI和支持向量聚类的网页文本分类算法

来源 :计算机应用研究 | 被引量 : 7次 | 上传用户:wori10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。
其他文献
提出一种基于分段模式的统计计数(counter segment)结构。Counter segment通过区分流量大小为每流分配计数器空间,使网络流根据其流量属性占用计数结构的不同段,避免了均匀分配等长计算空间带来的资源浪费,从而提高了存储空间利用率。在每段计数空间均使用两个并行哈希函数,提高了映射关系的精度。仿真表明,该结构能够保持较高的计数精度的同时更有效利用SRAM存储空间。
将多维实验方法应用于平面叶栅正反向流动实验中,避免了单参数实验方法中的缺陷,大大提高了实验数据的可靠性.同时采用改进的BP神经网络技术,对气动性能实验数据进行分析.实
在现代的风洞模型试验测量中,角度测量误差所引起的阻力系数误差大约占总阻力系数误差的四分之一左右,准确地测量模型的实际角度是提高数据准确度的一个重要因素.本文应用视
刺五加(Acanthopanax senticosus)为五加科刺五加Acanthopanax senticosus(Rupr.et Maxim.)Harms的干燥根及根茎或茎,具有益气健脾、补肾安神之功效。刺五加含有多种苷,其中的刺五
在CARDC-5的推进风洞中,对双锥柱体模型进行了侧向喷流干扰测力试验.本次试验是对于高超声速中侧向喷流的一次比较系统的研究,包括单喷管冷、热喷流干扰测力试验和双喷管冷喷
通过流动显示研究了Re=2350,粒子平均直径分别为150μm和350μm的两相圆湍射流中喷口加装小突片对射流混合的作用.探讨了不同粒径颗粒的存在对喷口小突片的射流混合作用的影响.通过PDA测量验证了流动显示结果.表明在150μm和350μm颗粒存在的情况下,小突片使射流核心区缩短的作用更加明显,而对射流的扩散作用却有所抑制.
模型迎角的测量是风洞试验中非常重要的环节。使用图像的测量方法能够在不影响模型的情况下对它的角度进行非接触的测量。提出了一种采用图像对模型迎角进行测量的方法,对系统
通过分析已有的Ad hoc体系结构存在的问题,提出了双簇头分层结构,并从首次簇头的生成、路由协议和数据通信三个实现要点详细介绍了双簇头分层结构;最后从平均簇数和吞吐率两个角度对双簇头与单簇头分层结构进行性能仿真和分析。其思想为Ad hoc体系结构的研究提供了新的方向。
利用节段模型的自由振动法来提取气动导数,这种方法其装置简单、易于实现,但在试验中结果并不完美.原因之一是模型可能会受到涡的影响,并且在高风速时,信号受干扰严重,信噪比
针对双方认证和密钥协商协议中会话双方属于不同密钥产生中心的情况,利用双线性对性质和BDH假设,基于可证安全的eCK模型提出一种基于身份可证安全的双方密钥协商协议。该协议从测试会话在随机谕示模型中是否存在相应的匹配会话两个方面,对提出的协议方案进行了安全性证明:若BDH假设不可解,则本方案是安全的认证密钥协商协议。