基于单词相似度的文本聚类

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:drake0266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类。实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果。
其他文献
关于"东亚的战争与和平"的课题不是仅限于日本、韩国、中国的问题,而是超国界的灾害,是需要世界各国持续关注并引向和平解决轨道的重要问题。战争与和平需要政治、经济、社会
互联网在进入Web2.0之后,社交网络发展迅速,Facebook、Twitter和Linked In等国外社交网站获得巨大成功。社交网络招聘也依托社交网络,开始有取代传统招聘模式之势。本文通过
提出了一种基于无人机视频的交叉口车辆检测和跟踪方法,以道路交叉口行车区域为检测区域,将车辆检测和跟踪分成独立的两个阶段,并使用背景差法检测车辆,接着使用置信度指标进
目的比较中长链脂肪乳及长链脂肪乳对老年胃肠肿瘤患者术后营养的疗效。方法29例老年胃肠肿瘤手术患者分为中长链脂肪乳组(MCT组,15例)和长链脂肪乳组(LCT组,14例),术后第2~7
<正>新闻报道要"接地气",这是由中国社会主义新闻事业的性质所决定的。新闻媒体要坚持为人民服务的宗旨,要联系群众,了解群众,重视民生新闻的报道,常运用平民化语言,善于利用
<正>国际大盗麦克左手拿着手机,右手拿起座机听筒,电话中传出了他自己的回声,大盗气得傻了眼:“我顶你个肺!”全场观众笑声一片。导演宁浩摸着黑儿,走出影院,笑容一直挂在脸
针对塞拉门漏雨的问题进行了原因分析,给出了解决方案,得到较好解决。
SWOT分析是战略分析的常用方法。SWOT分别是Strengths(优势)、Weaknesses(劣势)、Opportunities(机遇)、Threats(威胁)的简写。这种方法可以帮助我们全面分析互联网金融时代
目的探讨临床护理路径(CNP)和快速康复外科理念(FTS)在腹腔镜胃癌根治术围术期护理中的应用效果。方法选取2014年3月至2017年2月间四川省南充市中心医院嘉陵院区收治的156例
口语是人与人之间面对面地口头表达的语言,它是人类社会使用最频繁的交际工具。本文集中阐释了游戏——一种有效的提高英语口语课堂的教学效果的方法,在英语口语课堂上的设计