文本挖掘中同义与关联词集的构造算法研究

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:fjms001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析文本挖掘中的2个关键步骤——文本特征空间构造和相似距离度量,指出流行的文本挖掘过程中存在着大量同义和关联噪声。大量存在的同义词和关联词,造成文本特征空间无法准确表达文本语义以及高维计算复杂性问题。利用潜在语义分析和关联规则挖掘构造同义和关联词集,用于减少文本特征空间中的同义词和关联词,降低信息冗余,改进挖掘效率。文中对相应的算法进行了描述,实验结果令人满意。
其他文献
目的探讨丙泊酚复合米索前列醇进行人工流产术的临床效果。方法将600例要求无痛人工流产者分为两组,A组空服口服米索前列醇及丙泊酚,B组静脉注射丙泊酚。记录两组丙泊酚用量
目的观察初治排菌肺结核患者全程督导下短程化疗的近期和远期疗效。方法收集2007年1月—2010年12月在结防所治疗的初治排菌肺结核患者1716例,采用国家标准短程化疗方案H3R3Z3
基于两个对象在一段时间内的范围距离度量,给出了一种新的时空查询形式一全局最接近邻居查询。该查询检索移动对象在一段时间内范围距离最小的运动对象。通过考察查询和连续最
急性重症胰腺炎(SAP)又称急性出血、坏死性胰腺炎,属于急性胰腺炎的特殊类型,占整个急性胰腺炎的10%~20%,是一种病情凶险、并发症多、病死率高的急腹症.单利用传统的治疗效果差,
该文梳理了瑞士、美国、新加坡、香港地区的私人银行监管体系,并从宏观和微观、理论和实践、历史和现状等多个维度进行对比分析。结果表明:私人银行监管模式、监管机构的设置应
文章介绍了新一代文档标记语言XML,并对比HrML的缺点论述了XML的巨大优势、面临的挑战和未来发展前景.