基于概念信息量的特征权重计算方法研究

来源 :中国科学院声学研究所第四届青年学术交流会 | 被引量 : 0次 | 上传用户:kyonizuka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  特征权重是文本分类中分类计算的核心,对文本分类的效果有着重要的影响。现阶段特征权重计算中广泛采用TF*IDF方法,但这种方法忽略了特征项语义之间的关联性对权重的影响。针对该问题,提出了一种新的特征向量权重计算方法(TF*IDF*CIV),引入语义概念信息量CIV作为一个变量考虑在权重的计算过程中。实验结果表明,该算法是有效可行的,且在一定程度上提高了文本分类的正确率、召回率。
其他文献
  在各种语音识别应用中,置信度的可靠性对语音识别正确率都起着关键的作用。本文对基于声学层特征和语言层特征的后验概率置信度和基于上下文混合特征的条件随机场(Condit
  设计了一种基于混合高斯模型(GMM)的汉语普通话声调自动识别算法。汉语普通话连续发音时存在“连读变调”现象。针对该现象,对现有的基于GMM的声调识别算法提出了改进方案
  在基于总变化因子i-vector的说话人识别中,应用概率线性鉴别分析(PLDA)可以极大地提高性能。然而,PLDA假设的高斯分布并不能准确地描述i-vector,通过将高斯分布替换成重
  作为人们日常生活中必不可少的通信工具,手机经常在各种场合下使用,而由于复杂多变的背景噪声的存在,导致了通信语音质量的下降。在本篇文章中,提出一种基于功率级比的新双麦
  将信息增益和加权log似然比特征选择方法应用于音子配列学语种识别系统中进行特征降维。在美国国家标准技术研究院2009年语种识别评测数据集上进行实验,分别使用信息增益
  本论文是关于英语口语测试中问答题型的自动评测的研究.系统包括三个主要的部分:语音识别,打分特征提取和分数映射.大部分的打分特征的提取是基于语音识别的识别结果,所以
生物发光指荧光素酶与适当底物D-荧光素(LH2)、氨基荧光素(NH2-LH2)或其衍生物相互作用时产生的光.近年来在LH2、NH2-LH2及其类似物的合成方面已经取得了有意义的进展,通过不
  针对真实评测数据中噪声、方言口音、信道噪声、说话随意性等不利因素,本文对声学模型进行了深入地研究:在训练数据中加入背景噪声以增强模型的抗噪声能力;采用基于说话人的
几近将毕生精力都用在伦理学研究的江万秀认为,作为社会关系的总和,一个人可以不信仰宗教,但不能没有敬畏之心。当下中国道德建设上存在的一个深层痼疾,即社会转型期敬畏之心
化学指示卡与菌片对压力蒸汽灭菌效果检测的比较赵坚,张晓江(河北省唐山市路南区卫生防疫站,唐山,063000)在7所医院,同时用化学指示卡与嗜热脂肪杆菌芽胞菌片检测121℃压力蒸汽对注射器的灭菌