文本聚类中权重计算的对偶性策略

来源 :软件学报 | 被引量 : 0次 | 上传用户：zhou0168

【摘要】

：

在文本聚类／分类处理中，一个重要步骤就是寻找文本的合理表示。在被广泛采用的向量空间模型中，一个文本被表示成一个向量，向量的各维是特征项，而向量空间模型的核心问题就是如何进

【作者】

：

卜东波白硕李国杰

【机构】

：

中国科学院计算技术研究所

【出处】

：

软件学报

【发表日期】

：

2002年11期

【关键词】

：

文本聚类权重计算对偶性策略向量空间模型特征抽取隐含概念空间汉字信息处理 text clustering vector space module

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在文本聚类／分类处理中，一个重要步骤就是寻找文本的合理表示。在被广泛采用的向量空间模型中，一个文本被表示成一个向量，向量的各维是特征项，而向量空间模型的核心问题就是如何进行特征的抽取和选择。在特征的权重计算中，存在一种对偶性现象。利用迭代的方法来处理和利用这种对偶性，获得了文本的隐含概念。实验结果表明，采用概念空间代替原始词空间来表示文本，能够得到更好的聚类结果。

其他文献

论如何有效提高小学作文教学的效率

我国小学语文作文教学随着时代的变革逐渐走向成熟，在经济全球化的推动下，小学语文作文教学呈现多元化发展趋势。我国小学语文作文独具特色，无论是文体到内容，还是序列到方法上都

期刊

提高小学作文教学效率

基于端用户可控的IP网络路由体系结构和算法

IP网络的路由体系结构及算法是网络有效运行的关键技术.现行的路由体系结构及算法在实际应用中存在着一些问题.针对该问题,提出一种端用户可控的IP网络路由体系结构和具体的

期刊

INTERNETIP网络路由体系结构路由算法用户级别路由器IP routing architecture self-organizing end

高职院校家校合作育人探索研究

当前，高等职业教育大众化背景下，高职院校生源质量下降及“95后”成为当今高校的主流学生体，“95后”表现出的对家长过于依赖，使得高职院校在对学生进行思想政治教育时显得力不从

期刊

高职院校家校合作育人机制

提高初中信息技术教学质量的几个策略

在中学教学中，计算机操作课是一门操作性较强的学科，如何提高计算机操作课堂教学效果就值得众多计算机教师去努力探索；虽然“向45分钟要质量，提高课堂教学效果”，一直都是我们教师

期刊

教学质量信息技术课堂教学效果计算机操作计算机教师初中其他学科教学实践

中学语文课程改革背景下的作文课教学

为了促进中学生的全面发展，实现素质教育的目的，为提升学生的写作能力，综合中学生的性格特征，改革当下时代的作文课教学，引领学生与自然生活相贴切，结合传统教学方式，累积一些丰富的

期刊

中学语文课程改革作文课

一种高效可靠的移动Agent间通信机制

作为未来分布式系统的一种主流计算模式,移动Agent技术具有广阔的研究前景.协作与通信是移动Agent系统必不可少的组成部分.然而由于Agent的移动性和自主性,现有研究工作所提

期刊

移动计算移动AGENTAGENT通信消息传递mobile computing mobile Agent Agent communication m

椅背法整复肩关节前脱位

笔者自1997年7月-2005年6月采用椅背法整复肩关节前脱位26例，其中25例顺利复位，1例伴外科颈骨折转手术治疗。现报告如下。

期刊

肩关节前脱位椅背法正骨手法

针刺治疗脑卒中偏瘫后手功能障碍85例

目的：观察针刺治疗脑卒中偏瘫后手功能障碍的治疗效果。方法：采用针刺八邪、上八邪及合谷穴治疗脑卒中偏瘫后手功能障碍病人85例。结果：85例中，基本治愈29例，显效38例，好转14例，无效

期刊

手功能障碍/针灸疗法脑卒中穴八邪

特发性矮小的中医临床辨证论治

身材矮小患儿(尤其是不明原因的身材矮小)门诊量日益增多,叶进主任根据患儿不同的体质,将其分为肾精亏损、脾胃虚弱、肺气亏虚、肝血亏虚、心血不足5型,摸索出一整套中医辨证

期刊

特发性矮小/中医药疗法先天因素后天因素辨证论治

试论自学辅导教学模式在高中语文教学中的应用现状

据了解，促进青少年全方位发展的重要方法是引导学生自主学习，这样，可以提高学生的能力。因此，我国在教育规划中把提高高中教师的素质作为重要的工作，这样可以有效地提高高中语文教

期刊

自学辅导提高素养教学模式高中语文

文本聚类中权重计算的对偶性策略

与本文相关的学术论文