基于类别分布差异和特征熵的维吾尔语文本特征选择

来源 :计算机应用研究 | 被引量 : 7次 | 上传用户：joinrootcn

【摘要】

：

文本特征选择是在文本自动分类中最重要的一个环节。为了更好地解决维吾尔文文本分类中特征空间的高维性和文档表示向量的稀疏性问题,提出一种基于特征的类别分布差异和信息熵的维吾尔文文本特征选择方法。该方法不仅要考虑特征在类别间的分布情况,而且也要考虑特征在类别内的分布情况。采用本方法对维吾尔文文本语料进行了分类实验,并与一些传统的特征选择方法进行了比较。从结果来看,本方法在所选特征数更少的情况下,达到了比

【作者】

：

阿力木江·艾沙吐尔根·依布拉音库尔班·吾布力瓦依提·阿不力孜艾山·吾买尔

【机构】

：

新疆大学 a. 现代教育技术中心 b. 信息科学与工程学院,乌鲁木齐,830046新疆大学信息科学与工程学院,乌鲁木齐,830046;

【出处】

：

计算机应用研究

【发表日期】

：

2013年10期

【关键词】

：

特征选择文本分类特征熵支持向量机维吾尔语

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

建筑工程概预算编制对工程造价的影响与对策研究

本文通过对荣华二采区10

期刊

生态旅游资源保护的法律与政策实践——以汉中市为例

生态旅游强调人与自然和谐发展,是更加侧重保护旅游环境的一种可持续的旅游形式。在我国,经过20多年的发展,生态旅游逐渐被接受并得到重视。但在旅游实践中,大多生态旅游的发

学位

生态旅游资源法律保护政策支持管理监督

一种求解Job_Shop调度的变量排序启发算法

该文提出了搜索空间的概率模型,并以模型中的工序开工概率、工序对机床的独立需求概率和机床累计需求三个评价因子,构造了新的变量排序启发算法.仿真结果表明新算法在较小的

期刊

作业车间调度变量排序启发概率约束满足问题

双酚A与苯并[a]芘联合作用对三种乳腺上皮细胞的DNA损伤效应

[目的]观察双酚A(BPA)与苯并[a]芘(BaP)联合作用对三种乳腺上皮细胞DNA损伤的影响。[方法]采用对DNA双链断裂标志pH2AX免疫荧光检测的方法,观察环境相关剂量水平(10-9,10-7mo

期刊

乳腺上皮细胞DNA双酚A损伤效应苯并[a]芘人乳腺上皮细胞DNA损伤雌激素受体苯并β-雌二醇

心律失常和心肌病相关趋化因子网络研究进展

趋化因子是一类能介导细胞定向迁移的细胞因子,大量研究表明趋化因子参与心血管损伤反应的各个阶段。同时,趋化因子作为一种可潜在预测心血管风险的生物学标志广受关注,并可

期刊

心肌病趋化因子心血管疾病心血管风险细胞因子损伤反应生物学标志网络研究心肌细胞纤维化程度

《外婆的澎湖湾》教学设计

课标要求及分析《外婆的澎湖湾》与音乐课程标准课内容中的:二、表现演唱能够用自然的声音、准确的节奏和音调,有表情地独唱或参与齐唱、轮唱、合唱,并能对指挥动作做出恰当

期刊

中国最高军事学府的光辉历程--评介《中国人民解放军国防大学史》

由国防大学组织编写 ,校长裴怀亮、政委赵可铭主编的《中国人民解放军国防大学史》一书 ,全面系统地总结了该校的发展历程和办学治校的经验 ,实际上是对我军高级指挥院校发展

期刊

中国军事学府光辉历程评介人民解放军国防院校发展大学组织办学治校大学史指挥政委校长系统历史经验

正当程序原则在我国行政审判中的适用研究

由于行政机关自由裁量权不断扩大,导致行政机关滥用权力,损害公民合法权益的现象也逐渐增长。《全面推进依法行政实施纲要》提出将“程序正当”作为依法行政的基本要求之一,通过正当程序对行政公权力进行规制逐渐成为行政法学界关注的焦点。由于我国尚未制定行政程序法典,正当程序原则分散在各个单行法及地方规范性文件中,因此,在审判过程当中如何运用正当程序原则对行政行为进行合法性审查,以实现最低限度的公正,保障公民权

学位

法院行政审判正当程序原则法律适用

高中语文课堂教学实施趣味教学探究

本文针对当前高中语文课堂教学中存在的问题,阐述了高中语文课堂趣味教学的必要性。高中语文课堂教学实施趣味教学,是提高高中语文教学质量的必然要求,也是现代教育体制改革

期刊

高中语文课堂教学趣味性

论危险犯的既遂标准

危险犯是与实害犯相对应的一类犯罪,是理论和实务中至关重要的犯罪类型,危险犯的既遂标准是危险犯停止形态认定的关键。我国刑法对危险犯的研究主要根植于大陆法系刑法理论,

学位

危险犯法益侵害既遂标准危险状态

基于类别分布差异和特征熵的维吾尔语文本特征选择

与本文相关的学术论文