【摘 要】
:
将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种
【机 构】
:
北京石油化工学院计算机科学与工程系
论文部分内容阅读
将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核心,词所出现的文档为词的属性,根据词在搜索结果文档中共现的情况来划分类别.该方法可以充分利用词间的语义相关性,类别划分后即可确定类名.实验结果表明,对搜索结果聚类时与K-Means和STC算法相比,质量上有所提高.
其他文献
本文通过对51系列单片机最小应用系统和L波段雷达部分系统采用的51系列单片机电路的探讨,阐述AT89S51微处理芯片的工作原理。使得L波段雷达维护人员可以更好的理解L波段雷达各
运用Parikh-Wilczek的量子隧穿模型和黑洞热力学第一定律研究一般静态球对称黑洞的Hawking辐射,得到了静止质量为零和不为零的粒子穿过黑洞事件视界的出射率具有完全相同的函
2010年6月18日和7月7日闽西北山区泰宁县相继出现了两场大暴雨,均造成泰宁北面三个乡镇和泰宁县城区进水,财产损失严重,并造成人员伤亡。对这两场大暴雨的主要影响系统、物理量
利用基于阈值聚类算法首先对带类标记的样本数据集进行有指导性聚类,其主要目的是压缩训练数据集,解决KNN分类算法的样本选择问题以及孤立点的发现,用少量的更具代表性的聚类
提出并实现了一个基于小波和位平面技术的图像检索方法.首先依据二维小波子图的方向性特征,提出了一个兴趣点检测算法,并将该算法与位平面相结合进行图像兴趣点获取,然后将图像特征分为整体特征和局部特征进行提取,最后通过相似度测量实现了图像检索.由于该算法是对小波系数的位平面进行处理,有利于实现图像的压缩域检索.在考虑图像局部特征的同时也考虑了图像的整体特征,因此该算法亦具有较强的不变性.Corel图像库仿
通过对地下水渗流理论进行分析,计算出任意点、任意时刻的水位降深数据.根据固结理论得出地表沉降数据,通过交叉验证对插值方法有效性进行评价,根据有效性评价的结果选择出最
雷电流产生危害的途径有多种多样,我们既要防直击雷,也要防雷电电磁脉冲。本文主要从法拉第笼的原理以及应用这两个方面进行探讨。本文先介绍法拉第笼的原理,然后再提出法拉第笼
提出一种具有通用性的分布式异常检测框架.首先,利用本地的无监督异常检测算法,建立多个本地检测模型;然后,将各个本地无监督检测模型转换成统一的共享模型;最后,采用集成学
在无模板的条件下使用均匀外加磁场进行诱导,得到了具有均匀的形貌、很大的长径比和多晶结构的镍纳米线,并使用SEM、TEM、XRD等检测手段对产物等进行了表征.实验证明,通过改
《成本会计》是会计专业的一门主干课程之一,但《成本会计》课程教学存在诸多问题,必须加以重视。文章分析了《成本会计》课程教学存在的问题并提出解决的措施,旨在提高《成