基于词干的混合策略维吾尔语文本聚类特征选择方法研究

来源 :计算机应用与软件 | 被引量 : 4次 | 上传用户:clin_789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语文本聚类中特征选择对聚类的效率和效果都有直接影响。根据维吾尔语构词法规律,在原有基于文档频率特征选择算法基础上,提出新的维吾尔语文本聚类的特征提取算法。新方法将词干作为文本的特征项,在原算法上融合了基于特征贡献度的选择方法,并使用Java语言实现了一个维吾尔语文本聚类系统。使用该系统在人工分类的文本集上进行实验,结果表明:新的特征提取算法有效地降低了文本向量空间维度,在准确率、召回率和F-Measure等指标方面均有不同程度提高。
其他文献
目的采用高效液相色谱法(HPLC)测定生脉颗粒中尿囊素的含量。方法ZORBAXSB—C18(250mm×4.6mm,5um)色谱柱,以乙腈-0.1%醋酸(22:78)作为流动相,流速为0.8ml/min,柱温:30℃;检测波长:267am。结
目的 研究血清肿瘤标志物癌胚抗原(CEA)、糖类抗原15-3(CA15-3)、细胞角蛋白片段19(CYFRA21-1)联合检测对乳腺癌的诊断及复发监测中的意义.方法 采用电化学发光免疫法检测62
通过对圆的研究,使学生初步接触到研究曲线图形的基本方法.这样不仅扩展了学生的知识面,也使学生受到一些数学思想的启迪.通过对圆的有关知识的学习,不仅加深了对周围事物的
随着计算机应用于档案管理日益普及,这就要求我们要充分利用局域网络,稳步、有序地推进文档一体化管理进程,使档案工作尽快实现自动化,提高档案管理效率.文档一体化管理工作
基于元认知策略理论,针对高职高专非英语专业学生英语听力现状,提出了结合教学内容训练学生预测、筛选、释义、快速反应和短时记忆等听力学习策略的方法。本文旨在促进高职高
针对复杂零件的斜面斜孔加工,以四轴卧式加工中心加工的壳体零件为对象,分析了该零件的工艺要求和夹具设计要求,设计和制作了一款专用夹具,同时分析和计算了该夹具的定位误差
计算贯穿于小学数学教学的全过程,是日常生活和进一步学习必不可少的基础和工具。不论从基本的、长远的生活生产的需要,还是从学生成长期的学习需求来看,计算都有着非常重要的地
通过太原市热力公司自动控制系统的具体实例,论述了自动化控制技术在热网运行中的优势,即:不仅能提高工作效率,同时加强了热力管网调控手段,大大提高了供热服务质量,降低了能
移植术后免疫抑制剂的长期应用易并发肿瘤,威胁患者的生存,为此需同时兼顾抗排斥及抗肿瘤两个方面的治疗。本文对近年来器官移植中免疫抑制剂与肿瘤关系的文献进行了回顾总结
目的研究188Re-奥曲肽在荷瘤裸鼠体内的分布,为进一步肿瘤靶向治疗奠定基础。方法16只荷人H460非小细胞肺癌的BALB/c裸鼠分为4组,经尾静脉注射188Re-奥曲肽 18.5MBq(O.2ml).于注