使用特征词的统计分布信息进行文本分类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：nomaryo

【摘要】

：

文本分类是文本信息处理工作中的一个重要预处理部分.对常用的文本表示模型-向量空间模型的特征词权重估计方法提出了质疑,指出该方法的两个假设前提在一些情况下是不完全正

【作者】

：

邓擘樊孝忠

【机构】

：

北京理工大学

【出处】

：

计算机工程与应用

【发表日期】

：

2006年32期

【关键词】

：

特征词向量空间模型统计分布文本分类训练集 term Vector Space Model statistical distribution doc

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是文本信息处理工作中的一个重要预处理部分.对常用的文本表示模型-向量空间模型的特征词权重估计方法提出了质疑,指出该方法的两个假设前提在一些情况下是不完全正确的,并详细分析了造成这一问题的原因.在此基础上,提出了正确估计特征词权重的三个基本假设,并由此得出新的特征词权重估计方法和文本分类方式,最大限度地利用了文本信息.

其他文献

对农村集体财务和资产管理的思考

从财务委托代理、清账理财、电算化、民主理财、审计监督、财务公开与制度健全、凭证和账户管理、集体资产管理和加强组织领导等几个方面，探讨了农村集体财务和资产管理的有关

期刊

农村集体财务资产管理农民财务管理

面向服务的数学编程标记语言（MPML）

网格计算作为一种新的计算模式，是目前计算机领域的研究热点，如何在网格计算模式下进行程序设计是网格计算技术的一个重要研究方向。数学编程标记语言（MPML）是在兰州大学计算机数

期刊

网格计算MICEMATHMLMPML计算服务Grid Computing MICE MathML MPML computing ser

江苏·东海县成功举办全省首届草莓评比活动

本刊讯1月8—10日，中国江苏首届“东海水晶杯”草莓评比活动在东海县举办，决出金银奖各20名，组织奖4名。本次活动由东海县农业委员会和江苏省园艺站共同主办，共接收来自全省各地

期刊

草莓品种江苏省东海县比活农业委员会果实整齐度生物学特性技术培训班

XML与数据库数据的交互技术研究

从XML与关系数据库的特点入手,描述了两者之间的相互转换方法,并且以实例说明了XML与数据库的转换过程.

期刊

XMLDTD关系数据库转换eXtensible Markup Language（XML） Document Type Definition（DTD）

英国：柿果畅销

几年前，柿在英国人的水果盘里还难觅踪影，但现在它们可是这里最畅销的外来水果。2012年爷涎节期间，柿在英国市场销量陡增，超过了猕猴桃、栌果和鳄梨。2012年英国市场柿销售量较20

期刊

英国人柿果市场销量猕猴桃销售量水果鳄梨

对如何优化图书馆开架服务的探讨

文章指出,开架服务是图书馆发展的需要,更是满足读者需求的需要,就如何优化开架借阅管理提高服务水平进行了探讨。

期刊

图书馆开架服务书库管理

台湾中央大学洪惟助教授应邀来我校作讲座

9月13日，应我校艺术学院邀请，台湾中央大学中国文学系系主任洪惟助教授在九龙湖校区艺术学院会议室作了题为《台湾的昆曲研究与活动》的学术报告，报告会由艺术学院教授、博士生

期刊

中央大学台湾地区助教《东南大学学报》哲学社会科学版博士生导师艺术学院讲座

气象谚语与农业生产

谚语是劳动人民的口头创作，深深扎根于广大人民群众的生活，活在人民群众口头上，闪烁着智慧的异彩。谚语按内容可分为两类：一类是从劳动生产中产生的，有农谚和气象谚，这是劳动生产的

期刊

气象谚语农业生产节气变化农作物

麦秸覆盖的增产节水效应分析

全球气候变暖对许多地区的自然生态系统产生影响，导致干旱等灾害性天气频发、强度增加，且有分布不均匀等现状，因此开展了以提高水分利用率为目地的农业节水措施试验，试验表明，农田

期刊

全球气候变暖自然生态系统气象灾害农业节水秸秆覆盖

基于一类支持向量机的隐秘图像盲检测算法

针对二类支持向量机分类器在图像密写分析应用中训练步骤复杂与推广性弱的缺点,提出了基于一类支持向量机分类器的真彩隐秘图像盲检测算法,算法选用小波包高阶统计特征,仅对正常图像训练建立分类器。实验表明,算法在检测系统效率和推广性方面有较好的表现。

期刊

一类支持向量机盲检测图像密写分析小波包高阶统计One-class SVM blind detectionimage steganalysis hi

使用特征词的统计分布信息进行文本分类

与本文相关的学术论文