基于关键名词短语聚类的中文搜索结果聚类

来源 :计算机工程与应用 | 被引量 : 19次 | 上传用户:odu38sbfsw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。
其他文献
最近总在发生一些令人深感震惊的事情——比如迈克尔·杰克逊死了,比如美国《商业周刊》要被卖了。
在“流血的星期日”.美国的华尔街发生了一场让世人震惊的金融“海啸”,以美国雷曼兄弟宣告破产为标志的新一轮华尔街金融风暴,将全球股市扫荡得鼻青脸肿。
微软与欧盟反垄断机构的恩怨并没有因为前者的示好而得到有效缓解。相反,摩擦会因后者“不达目的不罢休”的坚持而继续下去,其目的无非是希望借此警示其他有可能违规的企业。
近期,PPG透露从美方融资1亿美元,开拓美国市场,上市计划因此搁置,但该公司对投资方的身份一直避而不答。2007年年末,PPG广告淡出市场,因债务问题官司缠身,同时有PPG资金链断裂的消息
对中文地名未登录词识别而言,首先充分挖掘地名用字本身的特征,及其上下文用字的特征,其次通过最大熵模型把这些来源不同的知识整合。在特征选择和知识获取时,通过对中文地名
本文从12所大学和大专院校中选取了36套理论力学试卷,分别从覆盖面、题目类型、题量、深度及难度四个方面进行了评价,得出了总排名和单项排名。结果显示,宁夏大学机械工程学
《IT时代周刊》在年初的文章中指出,中国经济的发展模式将会遇到不能逾越的发展掣肘,其大意是指中国长期引以为傲的廉价模式已步入古稀,后势看淡(《中国经济规模尚小 当世界强国
北京一直是人们关注的焦点.因为北京不仅仅是首都。而且是很多新事物的起源地。互联网、手机等新鲜事物都是从北京兴起之后传播到全国各地的。然而.北京移动资费下调的速度却远
思科不断扩张,涉足的领域过多,必将为它树立更多的竞争对手,但钱伯斯似乎习惯了竞争,这也是推动思科不断前进的动力
五一长假终于让我有了一些闲暇,除了阅读和处理杂志社的杂事,就是会一会好几年没有谋面的乒乓好友了。