利用概念知识的文本分类

来源 :应用科学学报 | 被引量 : 0次 | 上传用户:ppcppc825406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类.在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采用类别核心概念对特征项进行精选.依据类别核心概念相关的类别语义信息,提出了文档与类别关联度的计算方法,并根据类别关联度来判断文本类别.实验表明,该方法可有效降低特征空间维数,在提高分类效率的同时保证了分类效果,F1值略有提高.与SVM、KNN和Bayes分类器对比,当特征项数目较少时,该
其他文献
为了有效识别含有模糊形变的图像或特征,构造了正交Fourier-Mellin矩模糊不变量.通过获得形变图像和理想图像正交Fourier-Mellin矩之间的关系,推导出基于正交Fourier-Mellin矩函数的模糊不变量,然后利用该模糊不变量识别形变图像.实验表明,在不同模糊形变和不同强度噪声作用下,正交Fourier-Mellin矩模糊不变量的不变性均优于其他不变量,且对模糊形变图像的正确识别
企业非正式员工在当今社会中的出现是必然现象,这一群体的比例在不断扩大,在企业发展中发挥的作用也越来越重要,然而,他们很少受到企业的关注,也没有针对他们的有效的激励方式。对
根据历史的发展规律,女子乒乓球技术向男性化发展已成为主、客观能动变更的历史阶段。所谓女子技术男性化就是技术风格接近男性风格特点,首先是技术意识、战术意识、组合意识、
提出了一种包含随机运动的复杂密集场景下的目标跟踪方法.在跟踪算法中,将稀疏模型与多模块彩色特征相结合,并通过将其转化为l_1正则化最小二乘问题实现对特征的稀疏投影.跟踪过程中利用粒子滤波得到预测跟踪点,并将对应于最小投影差的预测点模块作为最优跟踪.为适应特征变化,在跟踪完成后根据新的跟踪结果自动更新目标模板.大量包含遮挡和光照变化的不同类型密集场景测试验证了该方法的有效性,与其他算法的比较说明了其
模糊时间序列预测模型在对不确定数据集的模糊趋势描述和论域划分方面有局限性,对此文中规范了直觉模糊时间序列的定义,应用直觉模糊C均值聚类算法优化论域区间划分,通过加入回
针对移动ad hoc网络对QoS的要求,提出一种能量优化和负载均衡的QoS路由协议.综合整条链路的能量和负载信息生成QoS参数,根据QoS选路算法建立链路.结合距离信息控制路由请求分
摘要:随着我国经济体制的变化,各行业纷纷呈现出快速发展的趋势,很多产品也随之发展,但发展中假冒伪劣产品的出售一直是经济发展需要解决的问题。比如卷烟市场,大量有名的或无名香烟都存在假冒的现象,且数量不断增加,损害了人们的身体健康,也损害国家的利益。  关键词:假冒伪劣卷烟;危害性;鉴别检验  假冒伪劣卷烟在社会上的流通,会侵占从正确渠道生产的烟的销售额,而人们如果长时间吸这类卷烟,也会破坏原有的身体
随着无线网络的广泛应用,其安全问题逐步显现。面临非法接入、信息数据的篡改和泄露、病毒侵入和DOS攻击等问题,结合当前无线网络安全技术,总结归纳建立无线局域网安全屏障的几
分析了IEEE 802.11 DCF协议虚拟载波检测机制在支持多速率传输方面存在的局限性,以及高速率传输数据分组的重负载条件下多跳ad hoc网络的节点拥塞问题,并在DCF协议框架内提出
提出一种基于盲信号分离的方法对MIMO信号进行调制识别.该方法对接收信号的相关矩阵作奇异值分解,用于估算发射天线数目,并对信号进行白化.采用特征值矩阵的联合近似对角化(jo