TCBPL:一种高效文本分类新方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zhuyanmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据模式聚合理论(PA)和隐含语义分析理论(LSA)提出了一种文本分类新方法--TCBPL方法,该方法应用PA理论和LSA理论来构造向量空间模型,大大削减了特征向量的维数,同时增强了稀有词的作用,并在特征向量中引入了语义成分,从而提高了分类的速度和精度.
其他文献
介绍了一种基于联合得分的实时孤立词语音识别系统。在识别阶段,通过内插向最得到两种改进的DTW算法,并且和基本的DTW联合起来对语音进行识别,得出各自的识别结果,最后把所有的结
以网站作为Web图的顶点,以网站之间链接为有向边,研究了中国境内Web图的拓扑特点和宏观结构.试验表明:网站的入度和出度分布同样服从幂级数定律(Power Law);境内Web图的连通
基于统计暴露攻出的原理,提出了在确定和不确定通信对象个数情况下的统计暴露攻击算法,分析了算法中的显著性因子对攻击有救性和攻击轮数的影响。在此基础上,提出了发送者掩护和