一种基于语义概念的中文文本分类方法

来源 :第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会) | 被引量 : 0次 | 上传用户:zsh188667787
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从Web文本自动分类的需求出发,针对基于VSM(vectorspacemodel)模型的分类处理中词的无关性假设及词的维数过高等问题,结合Hownet,提出一种基于语义概念的中文文本分类方法.通过语义概念分析可以达到对传统词特征向量的排歧和降维,并在此基础上对文本进行分类处理.本文提出并实现一个基于SVM(supporrvectormachines)中文文本分类的原型系统,对中等规模的文本语料库的实验表明,本系统是有效的.
其他文献
本文介绍一种由双微处理器控制的IGBT逆变式焊接切割电源,该电源采用PWM技术,将手弧焊、手工氩弧焊和空气等离子切割等功能在一套主电路中实现,具有体积小、重量轻、负载持续率高、抗干扰性能强、可靠性高、操作简便、数字显示、性价比高等突出特点.
本文介绍降压型功率变换器LM2596的原理和应用.
本文从中国实际情况出发,结合国际动态,就我国开关电源未来发展中应注意的几个问题:完善的设计、计算机仿真、生产规模、制造工艺、可靠性重视程度和产品更新速度等,做初步探讨,供讨论.
不间断电源UPS的用户设备,都是清一色的计算机及其外设,这些设备都采用了开关稳压电源,不一定需要交流供电,而直流供电免除了谐波干扰,更增加了数据处理、传输的安全性和可靠性.无逆器不间断电源UPSWI免除传统UPS中的逆变器,对用户设备实现直流供电,在保留所有外部特征的同时,各项技术性能都大大超过,而成本、体积、重量、功耗均为相同功率传统UPS的十分之一;无功耗不间断电源UPSWM是UPSWI的后继
本文基于开关函数建立准谐振变换器的全阶非线性电路模型,并用等效小参量法进行分析,得到了全符号表示的谐振元件和滤波元件状态变量的直流解和纹波解.文中分析方法表明,利用开关函数的非线性建模及等效小参量分析,可统一PWM类及谐振类变换器的分析.
分析了铜冶炼SO烟气流程中风机调速的特点.结合技改工程实例,对变频调速系统的构成和变频器的结构特点进行了论述.直接转矩控制变频器的电机辨识运行及磁通优化功能使调速系统高效、节能.
介绍一种新型高频斩波调压电路,对其工作模式作了详细分析,给出阻性负载和感性负载的仿真结果.
Mel频率倒谱系数(MFCC)表征了人类的听觉特征.目前国内外提出了一些比较好的MFCC改进算法,可以提高语音特征提取的鲁棒性.本文介绍了一些在语音识别中取得一定效果的Mel倒谱提取的改进算法.将这些算法应用于文本无关的说话人识别,并在此基础上提出了四种改进方法.在100人和200人的电话语料库中,分别进行同信道和不同信道的实验,使识别率获得了不同程度的提高.尤其在不同信道上的识别效果更为显著.其
本文提出了一种联合二维主分量分析(Joint-2DPCA)的图像描述方法,并将其应用到人脸识别.该方法不仅继承了现有2DPCA方法可直接面向图像矩阵进行操作的优点,而且通过两次图像映射的有效集成达到了图像水平、垂直方向维数的联合压缩,弥补了2DPCA方法只能压缩图像水平方向维数的不足,使得特征数目得到大幅度的降低,匹配识别速度也因此得到了大幅提高.
智能环境中的会议档案系统是典型的普适计算研究的一个热点,也为研究普适计算提供了一个基本的实验环境.本文研究了一种基于觉察上下文的实时档案系统,在该系统中提出了一种基于觉察上下文的多层次事件检测的系统框架模型,在该模型指导下,对上下文动态地建模,以及在上下文的指导下,进行不同层次事件的检测.相比较现有的会议档案系统,该系统具有觉察上下文机制,实时特征选择与提取以及多层次事件检测等特点.