最大判别特征选择算法在文本分类的优化研究

来源 :四川大学学报:自然科学版 | 被引量 : 0次 | 上传用户:loveging87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一个新的特征向量ε用于分类,使得从中选取的部分特征词具有最大的类别区分能力.仿真结果表明,与cMFD,CSFS和CMFS三种特征选择算法相比,MD特征选择算法能在选取较少特征词情况下,获得更高的分类精度.
其他文献
利用Green函数的性质和Schauder不动点定理,本文研究一类带积分边值条件的非线性o型分数阶微分方程边值问题,得到该边值问题正解的存在性定理,推广了相关结果,Caput并举例说
量子相对熵在保迹完全正定的映射作用下是单调递减的.此外,对于一种新提出的Sandwiched Rneyi量子相对熵,当映射满足Schwarz不等式或映射保迹正定时,也有研究证明该量子相对
设D是复平面中的开单位圆盘,φ是D到自身的解析映射,H(D)是D上的解析函数空间.为了统一研究复合算子、乘积算子和微分算子三者的乘积,Stevic和Sharma引进了如下的Stevic-Sharma算
理论研究了H2^+分子取向对谐波空间分布的影响.结果表明:当激光偏振方向与分子轴方向一致、谐波辐射满足激光场正向时,负向H核谐波辐射强度大于正向H核;激光场反向时,正向H核
采用密度泛函B3P86和单双取代耦合团簇CCSD(T)/cc-PV5Z方法,结合Dunning相关一致五重基cc-PV5Z优化计算外加不同电场下的PH分子结构,同时扫描单点能,获得不同外电场作用下的
本文研究具有双输入时滞的网络控制系统的稳定性.本文首先把整个时滞区间划分为三个子区间并构造了一个新的Lyapunov泛函,该泛函可以充分利用所有时滞的信息.然后本文运用Wir