基于本体及相似度的文本聚类研究

来源 :计算机应用研究 | 被引量 : 3次 | 上传用户:dh5601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类忽略概念的内涵及缺少概念间的联系,设计和改进了基于本体和相似度的文本聚类方法TCBOS(textclusteringbased on ontology and similarity)。研究了文本预处理及分词的方法,设计了用有限状态自动机来自动提取概念和关系的方法,对概念语义扩展和相似度计算方法进行了改进和完善,通过应用本体的语义相似度来度量文档间相近程度,完善了根据相似度进行文本聚类的K中心点算法。实验证明,该方法从聚类的准确性和聚类的关联度方
其他文献
本文着重论述提高五年制高职语文课堂“温度”的迫切性、五年制高职语文课堂“温度”体系的构成,并以自身语文教学实践为例,论述提高五年制高职语文课堂“温度”的举措。
本文从现代大学的功能说起,强调了高校图书馆在高校建设和发展中的核心地位和。重要作用,论述了图书馆的发展应该坚持以人为本的理念,以及以人为本的图书馆的发展路径。
英语书面表达能力是学习者英语语言能力和应用能力的体现,是学习者语篇衔接手段应用能力的体现。语篇分析有助于学生全面理解语言的含义、连贯并准确地表达自己思想的能力;而
近年来,学生课堂展示逐渐成为大学英语常见的教学活动,小组博客在英语教学中的作用也日益凸显.但目前将两者结合的研究较为少见。学生课堂展示活动中可以加入两次小组博客讨论,使
随着全球化和互联网的普及发展,经济人和数字人悄然出现,人文缺失已露端倪。高等院校也不能例外,高校学生思想政治工作面临着新形势、新特点,思想政治工作者必须针对大学生人文关
学科是高等学校事业发展的基础,是高校的立足之本。学科建设是高校发展的核心。广西高校学科发展要坚持内涵和外延相结合、以内涵为主的学科建设思路,苦练内功,瞄准前沿,抓住重大
本文通过对高校图书馆教材馆藏建设及如何充分发挥图书馆教材图书功能的探讨,提出了高校图书馆教材馆藏建设及图书功能开发的相应措施。
在高校毕业生就业形势越来越严峻的情况下,培养自主创业型人才,以创业带动就业,是实施扩大就业战略的重要措施之一,本文通过分析高职高专衣科类专业自主创业型人才培养的重要性和
通过2008年的补充调查,确定祥云县低产林改造面积63522.5hm^2.分析了祥云县形成大面积低产林的原因,实施低产林改造的有利因素、实施原则及安排顺序.详细规划了低产林改造的方式、
我国高等教育学历文凭考试于1993年诞生,至2007年结束。文凭考试是国家对尚不具备颁发学历文凭资格的民办高等教育机构的学生组织的学历认定考试,也是以学校办学和国家考试相结