基于词性特征提取的藏文文本分类方法研究

来源 :2011年中国计算机学会服务计算学术会议(CCF NCSC2011) | 被引量 : 0次 | 上传用户:ggf9988998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文在介绍信息增益、互信息、χ2(CHI)统计量和期望交叉墒四种常用的藏文文本分类提取特征词的基础上,研究了基于词性特征提取的方法和特征词权重计算,同时介绍了基于词性特征提取的算法描述和流程图,并通过引进查全率、查准率和F-测试对线性可分支持向量机分类的准确性进行评测,最后引进G函数对基于词性特征提取方法提取特征词效率和降低向量维数效果进行检验,实验结果证明基于词性特征提取的方法缩减了特征词的个数,降低了向量的维数,而且分类的准确性大大提高。
其他文献
  在现场勘查中,我们经常会提取到各类纸质购物袋,尤其是一些表面亚光性质的,且大多有图像。提取这类客体表面潜在的或反差很微弱的疑难指纹、足迹,难度较大。用常规照相提取,背
  随着便携式核仪器的广泛应用及其对电源的特殊要求,便携式核仪器的电源管理成为该领域研发的一项关键技术。如何实现良好的电源管理,对便携式核仪器具有重要的现实意义。论
  电离室是中国散裂中子源束流损失监控系统中最重要的探测器之一,是加速器调试和运行过程中阻止过量辐射和仪器损伤的主要诊断工具。我们根据改进后电离室的设计,进行了总计
  本研究利用电化学阻抗谱研究几种涂覆在铝合金基材上的防腐蚀涂层在3.5%氯化钠溶液中的失效过程,通过分析最低频率阻抗值、涂层电阻、涂层电容比较这几种涂层的耐蚀性优劣,
  采用极化曲线、电化学阻抗以及扫描电镜(SEM)和能谱分析(EDS)研究温度对300M 和超高强不锈钢腐蚀行为的影响。温度由10 ℃升高到50 ℃,300M 和超高强度不锈钢的腐蚀电位Ec
  本文经过多步合成反应,获得了两个二芳烯类光致变色分子:4,5-二(2,5-二甲基噻吩)邻苯二腈及4,5-二(2,5-二甲基噻吩)邻苯二甲酰亚胺。这两个分子具有光致变色性能,在溶液中经紫外
  功能性喷墨材料结合了功能性材料与喷墨技术的优点,在目前的显示器领域、电子领域、化学与生命科学等领域取得应用。本文对功能性喷墨材料如导电材料、半导体材料、电介质
  本文设计合成了具有新型取代基的萘并吡喃类化合物,改变显色体时的吸收波长和色深,重点在萘并吡喃的5 、6-位,以及3-位二芳甲烷上,引入取代基产生p-共轭效应,扩大开环显色体的
  液晶/聚合物复合材料在柔性显示领域具有广阔的应用前景。离子掺杂近晶A型液晶 (Ion-doped SmA LC )具有双稳态特性,在不同频率的交流电场中具有不同的分子排列方式:在高频交
  现行的以最终用户为中心的服务组合技术大都以计算机可执行的服务为组合的基本元素,没有考虑能够提供服务能力的人;同时,服务组合的结果一般只适合于需求明确、业务流程可预