文本挖掘中同义与关联词集的构造算法研究

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户：fjms001

【摘要】

：

通过分析文本挖掘中的2个关键步骤——文本特征空间构造和相似距离度量，指出流行的文本挖掘过程中存在着大量同义和关联噪声。大量存在的同义词和关联词，造成文本特征空间无法

【作者】

：

亓俊红张文东

【机构】

：

莱芜职业技术学院计算机系,山东大学网络信息安全研究所,中国石油大学计算机与通信工程学院

【出处】

：

微电子学与计算机

【发表日期】

：

2007年4期

【关键词】

：

文本挖掘潜在语义分析关联规则挖掘算法 text mining latent semantic analysis mining of association

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过分析文本挖掘中的2个关键步骤——文本特征空间构造和相似距离度量，指出流行的文本挖掘过程中存在着大量同义和关联噪声。大量存在的同义词和关联词，造成文本特征空间无法准确表达文本语义以及高维计算复杂性问题。利用潜在语义分析和关联规则挖掘构造同义和关联词集，用于减少文本特征空间中的同义词和关联词，降低信息冗余，改进挖掘效率。文中对相应的算法进行了描述，实验结果令人满意。

其他文献

丙泊酚复合米索前列醇行人工流产的疗效分析与评价

目的探讨丙泊酚复合米索前列醇进行人工流产术的临床效果。方法将600例要求无痛人工流产者分为两组,A组空服口服米索前列醇及丙泊酚,B组静脉注射丙泊酚。记录两组丙泊酚用量

期刊

丙泊酚米索前列醇无痛人工流产

初治排菌肺结核短程化疗1716例近远期疗效研究

目的观察初治排菌肺结核患者全程督导下短程化疗的近期和远期疗效。方法收集2007年1月—2010年12月在结防所治疗的初治排菌肺结核患者1716例,采用国家标准短程化疗方案H3R3Z3

期刊

肺结核化学疗法治疗结果

移动对象全局K最接近邻居查询研究

基于两个对象在一段时间内的范围距离度量，给出了一种新的时空查询形式一全局最接近邻居查询。该查询检索移动对象在一段时间内范围距离最小的运动对象。通过考察查询和连续最

期刊

移动对象数据库最近邻居查询分支界定算法R树moving object databases nearest neighbor query branch a

急性重症胰腺炎患者7例的护理体会

急性重症胰腺炎（SAP）又称急性出血、坏死性胰腺炎,属于急性胰腺炎的特殊类型,占整个急性胰腺炎的10%～20%,是一种病情凶险、并发症多、病死率高的急腹症.单利用传统的治疗效果差,

期刊

胰腺炎重症急性护理

私人银行监管体系的国际比较及启示

该文梳理了瑞士、美国、新加坡、香港地区的私人银行监管体系，并从宏观和微观、理论和实践、历史和现状等多个维度进行对比分析。结果表明：私人银行监管模式、监管机构的设置应

期刊

私人银行监管体系银行保密制度自律组织国际比较

文档标记语言XML的发展前景分析

文章介绍了新一代文档标记语言XML,并对比HrML的缺点论述了XML的巨大优势、面临的挑战和未来发展前景.

期刊

文档标记语言电子商务HTMLXMLJAVA发展前景markup languageE-commerceHTMLXMLJava

文本挖掘中同义与关联词集的构造算法研究

其他学术论文