利用概念知识的文本分类

来源 :应用科学学报 | 被引量 : 0次 | 上传用户：ppcppc825406

【摘要】

：

针对统计方法不能从语义理解的角度进行文本分类的问题，提出了利用概念层次网络概念知识进行文本分类的方法，包括两部分：依据概念进行特征选取以及根据类别关联度分类．在特征选取

【作者】

：

丁泽亚张全

【机构】

：

中国科学院声学研究所,中国科学院研究生院

【出处】

：

应用科学学报

【发表日期】

：

2013年2期

【关键词】

：

文本分类概念层次网络概念概念区分度类别关联度 text categorization hierarchical network of concepts

【基金项目】

：

国家“863”高技术研究发展计划基金（No.2012AA011102）,国家语委“十二·五”科研项目基金（No.YB125-53）,中科院声学所知识创新工程项目基金（No.Y154141431）,中国科学院学部咨询项目基金（No.Y129091211）资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对统计方法不能从语义理解的角度进行文本分类的问题，提出了利用概念层次网络概念知识进行文本分类的方法，包括两部分：依据概念进行特征选取以及根据类别关联度分类．在特征选取时，通过计算概念与类别的区分度挖掘出类别核心概念，并采用类别核心概念对特征项进行精选．依据类别核心概念相关的类别语义信息，提出了文档与类别关联度的计算方法，并根据类别关联度来判断文本类别．实验表明，该方法可有效降低特征空间维数，在提高分类效率的同时保证了分类效果，F1值略有提高．与SVM、KNN和Bayes分类器对比，当特征项数目较少时，该

其他文献

正交Fourier—Mellin矩模糊不变量的构造及应用

为了有效识别含有模糊形变的图像或特征,构造了正交Fourier-Mellin矩模糊不变量.通过获得形变图像和理想图像正交Fourier-Mellin矩之间的关系,推导出基于正交Fourier-Mellin矩函数的模糊不变量,然后利用该模糊不变量识别形变图像.实验表明,在不同模糊形变和不同强度噪声作用下,正交Fourier-Mellin矩模糊不变量的不变性均优于其他不变量,且对模糊形变图像的正确识别

期刊

模糊图像识别模糊不变量正交Fourier—Mellin矩recognition of blurred image blur invariant ort

论企业对非正式员工的激励

企业非正式员工在当今社会中的出现是必然现象，这一群体的比例在不断扩大，在企业发展中发挥的作用也越来越重要，然而，他们很少受到企业的关注，也没有针对他们的有效的激励方式。对

期刊

企业非正式员工激励机制

女乒技术男性化趋势探讨

根据历史的发展规律，女子乒乓球技术向男性化发展已成为主、客观能动变更的历史阶段。所谓女子技术男性化就是技术风格接近男性风格特点，首先是技术意识、战术意识、组合意识、

期刊

乒乓球技术男性化趋势

多模块稀疏投影在密集场景目标跟踪中的应用

提出了一种包含随机运动的复杂密集场景下的目标跟踪方法.在跟踪算法中,将稀疏模型与多模块彩色特征相结合,并通过将其转化为l_1正则化最小二乘问题实现对特征的稀疏投影.跟踪过程中利用粒子滤波得到预测跟踪点,并将对应于最小投影差的预测点模块作为最优跟踪.为适应特征变化,在跟踪完成后根据新的跟踪结果自动更新目标模板.大量包含遮挡和光照变化的不同类型密集场景测试验证了该方法的有效性,与其他算法的比较说明了其

期刊

视频跟踪稀疏表示密集场景多模块彩色特征粒子滤波visual tracking sparse representation crowded scen

基于确定性转换的IFTS预测

模糊时间序列预测模型在对不确定数据集的模糊趋势描述和论域划分方面有局限性，对此文中规范了直觉模糊时间序列的定义，应用直觉模糊C均值聚类算法优化论域区间划分，通过加入回

期刊

直觉模糊集时间序列确定性转换intuitionistic fuzzy set time series deterministic transition

能量优化和负载均衡的QoS按需路由协议

针对移动ad hoc网络对QoS的要求,提出一种能量优化和负载均衡的QoS路由协议.综合整条链路的能量和负载信息生成QoS参数,根据QoS选路算法建立链路.结合距离信息控制路由请求分

期刊

移动ADHOC网络QOS参数能量优化负载均衡距离信息本地修复mobile ad hoc networks QoS parameter ener

浅谈假冒伪劣卷烟的危害性及其鉴别检验的方法

摘要：随着我国经济体制的变化，各行业纷纷呈现出快速发展的趋势，很多产品也随之发展，但发展中假冒伪劣产品的出售一直是经济发展需要解决的问题。比如卷烟市场，大量有名的或无名香烟都存在假冒的现象，且数量不断增加，损害了人们的身体健康，也损害国家的利益。　　关键词：假冒伪劣卷烟；危害性；鉴别检验　　假冒伪劣卷烟在社会上的流通，会侵占从正确渠道生产的烟的销售额，而人们如果长时间吸这类卷烟，也会破坏原有的身体

期刊

假冒伪劣卷烟危害性鉴别检验

无线局域网安全问题探讨

随着无线网络的广泛应用，其安全问题逐步显现。面临非法接入、信息数据的篡改和泄露、病毒侵入和DOS攻击等问题，结合当前无线网络安全技术，总结归纳建立无线局域网安全屏障的几

期刊

无线网络网络安全安全策略wireless network safety of network safety strategy.

一种支持拥塞识别的ad hoc网络DCF协议速率自适应机制

分析了IEEE 802.11 DCF协议虚拟载波检测机制在支持多速率传输方面存在的局限性,以及高速率传输数据分组的重负载条件下多跳ad hoc网络的节点拥塞问题,并在DCF协议框架内提出

期刊

adHOC网络DCF协议多速率拥塞识别ad hoc networks DCF protocol multi-rate congestion aw

MIMO信号调制方式盲识别

提出一种基于盲信号分离的方法对MIMO信号进行调制识别.该方法对接收信号的相关矩阵作奇异值分解,用于估算发射天线数目,并对信号进行白化.采用特征值矩阵的联合近似对角化（jo

期刊

调制识别多输入多输出盲分离谱特征四阶累积量modulation recognition multi-input multi-output（MIMO）

利用概念知识的文本分类

与本文相关的学术论文