论文部分内容阅读
本文在介绍信息增益、互信息、χ2(CHI)统计量和期望交叉墒四种常用的藏文文本分类提取特征词的基础上,研究了基于词性特征提取的方法和特征词权重计算,同时介绍了基于词性特征提取的算法描述和流程图,并通过引进查全率、查准率和F-测试对线性可分支持向量机分类的准确性进行评测,最后引进G函数对基于词性特征提取方法提取特征词效率和降低向量维数效果进行检验,实验结果证明基于词性特征提取的方法缩减了特征词的个数,降低了向量的维数,而且分类的准确性大大提高。