一个基于字特征的文本分类模型

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ghostframe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于字特征的中文文本分类方法。该方法的出发点是变常用的基于表层的匹配为基于概念的匹配.用汉字特征向量作为文本的表示方法。算法根据文本中汉字的特征建立文本表示矩阵和类别表示矩阵,并通过线性最小二乘算法形成分类矩阵。
其他文献
处红柚Citrus maxima(Burm)Merr.cv.Chuhong系从实生柚中选育出的新品种,2008年2月通过浙江省林木良种审定委员会审定并命名。
对于大规模无线传感器网络的路由协议进行了研究,提出了基于最小跳数的路由协议。详细介绍了最小跳数场的建立过程,从理论上证明了每个节点只会收到一个导致最小代价变小的信息
蓝牙协议定义了灵活的编码方案(检纠与纠错机制),可针对不同的链路质量选用不同的编码方案,并可映射到相应的数据分组格式上,这为可靠的通信提供了有力的保证。文章简要地分析了
在Web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。这篇论文将通过分析一些典型的权重函数的构造,提出一个基于文档信息空间的权重函数来计算调整
寒喘证是以呼吸困难,张口抬肩,鼻翼煽动,不能平卧,伴喘息,咳嗽,呼吸气促,胸部胀闷,痰稀薄带泡沫,色白质黏或伴头疼,恶寒等为特征的病症。该病是多种因素共同致病的结果,主要
仙岛明珠是用潍坊甜油桃3号作母本.红珊瑚、NJN72等品种混合花粉作父本杂交育成。2008年7月通过烟台市科技局组织的品种鉴定。
目的:旨在探讨PRODH基因与汉族人群精神分裂症的时空联系。方法:采用聚合酶链式反应-限制性片断长度多态性方法,分析330例精神分裂症患者和344例正常对照者中PRODH*1945(T/C)多态性
1范围 本标准规定了番木瓜(Catica papaya L.)鲜果的技术要求、试验方法、检验规则以及包装、标志、标签、贮存和运输。本标准适用于番木瓜鲜果。2规范性引用文件 下列文件中的
目的:观察热休克蛋白90(HSP90)在缺氧心肌细胞中的表达变化规律,并初步阐明HSP90在早期心肌缺氧损害中的作用。方法:原代培养SD大鼠乳鼠心肌细胞,随机分为正常对照组、缺氧组和加HS
该文介绍了笔者实现的一个代理服务器系统,该系统可代理HTFP,Tunnel,Socks5TCP这三个最常用的协议,此外系统还有用户管理和Web服务、Web代理等功能。