基于类内关键词的中文文本分类模型的改进

来源 :广西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:zxhdbd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文文本分类模型中提出文本的KWP度量。在文本分类系统中SVM决策表上建立CKWP约简方法,利用CKWP值标注训练集文本的方法改进了中文文本分类系统。实验结果表明,CKWP标注后的文本提取规则在决策过程中拥有更大的权重、更高的优先级,同时,CKWP标注后的KNN方法在查全率、查准率、微平均三个指标上领先标准方法及粗糙集方法。
其他文献
目前的图像诊断系统,大多数采用形态学和色度学特征并结合专家系统,对癌细胞进行分析和诊断。为了更好地对肺癌细胞进行识别,本文利用图像处理的相关知识对肺癌细胞图像进行形态学和色彩学的特征提取,在此基础上利用属性论中的定性映射与转化程度函数对肺癌细胞进行分类识别。实验结果证明本文提出的方法可以取得较好的结果,说明属性论方法在模式识别领域还是具有应用价值的。
采集广西某电镀厂废水处理站尾水塘的底泥和水体样品,并连续两年对河流附近沿岸稻田土壤及水稻进行分析,以确定废水处理站尾水重金属对附近土壤和稻田的环境影响。结果表明,土壤
目的探讨组织多普勒成像(TDI)技术测量二尖瓣舒张早期左室充盈峰值流速(E)/舒张早期运动速度峰值(Ea)评价胸部放疗对患者左心室功能影响的临床价值。方法将80例患者依据是否
日前,中国科协在北京隆重表彰了第三届全国优秀科技工作者,我校梁宏校长作为广西科技界的4名代表之一榜上有名.
补充报道了采自广西猫儿山国家级自然保护区的天牛科昆虫17种,其中2属8种为广西新记录属、种。对该保护区天牛科昆虫的垂直分布及柄天牛害虫作了简单的介绍。另外记述天牛科昆
在HCl介质中,AuI2^-与阳离子表面活性剂可形成较稳定的缔合微粒,它在560nm产生一个吸收峰,在320,470nm产生2个同步散射峰,在580nm产生1个共振散射峰.在一定条件下,阳离子表面活性剂
介绍了从关系数据库到XML数据库转换的两种方法:面向XML的XML模板转换和面向DB表格模型转换;设计了面向DB的表格模型转换的中间件;实现了在B/S网络环境下用ASP调用中间件,将关系数
研究了DBC-偶氮胂与铬(Ⅲ)的显色反应.结果表明,在弱酸性介质中及加热条件下,DBC-偶氮胂与铬(Ⅲ)形成2∶1的蓝色配合物,最大吸收波长在625nm,表观摩尔吸光系数为2.46×10
以聚酰胺树脂为吸附剂,通过静态和动态法研究了其吸附水溶液中硝基苯酚的性能、条件及其主要影响因素.结果表明:在弱酸性条件下,该树脂对水溶液中多元硝基苯酚有强吸附能力,
目的探讨ω-3鱼油脂肪乳对慢性阻塞性肺疾病急性加重(AECOPD)行机械通气患者氧化应激及炎症反应的影响。方法将92例AECOPD患者随机分为观察组47例和对照组45例。两组均予常规