基于文本聚类搜索引擎的查询扩展算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:liuleizishen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前多数基于文本聚类搜索引擎的研究对于聚类产生的小聚类簇查询未能给出深入查询解决方案,针对此类问题提出了一种基于聚类的查询扩展算法。此算法利用簇关系树结构改进相似度公式,对目标簇提取主题词并进行二次查询后,通过K中值聚类算法对查询结果进行聚类以对其进行扩展。此算法全部过程均为离线运算,旨在避免在线运算影响查询响应效率,并通过实验验证了该算法的有效性。
其他文献
本文分析了数字化图书馆建设的重要因素,结合自身馆建条件加快数字化建设的步伐,紧 跟时代要求,满足读者需求.
Designing energy-efficient Medium Access Control (MAC) protocols has a significant influence on the energy performance of wireless sensor network (WSN). In this
在多机器人协同搬运过程中,针对传统的强化学习算法仅使用数值分析却忽略了推理环节的问题,将多机器人的独立强化学习与“信念-愿望-意向”(BDI)模型相结合,使得多机器人系统拥有
考虑物流网络需求的不确定性,运用区间分析理念以区间数度量不确定性变量与参数,建立区间需求模式下的物流网络设计的混合整数规划模型,定义风险系数与最大约束偏差,对模型进行目
The Information Technology at Home has caught the attention of various industries such as IT,Home Appliances,Communication,and Real Estate.Based on the informat
为了进一步提高检索系统的整体效率,提出了一种分块组织技术的倒排索引方法。具体研究过程是在数据统计的基础上产生倒排索引的检索性能模型,分析倒排文件分块索引项的组织策
<正> 东北国有林区在我国林业建设与发展中地位举足轻重,其改革与发展是我国林业经济研究的热点之一。近年来,围绕国有林区的“两危”问题的探讨层出不穷,但纵观这些探索大都
针对退化图像复原问题,提出了一种基于高维空间几何理论(HDSG)的PSO-BP神经网络图像复原方法。高维空间几何理论中的同胚映射和同源连续性原理,把图像映射为高维空间中的一个点,通过回归原模糊图像和由此图像衍生出的几幅更加模糊的图像对应在空间中几个点的分布曲线,得到清晰的复原图像。在该理论基础上,用PSO-BP神经网络来确定高维空间中各点的关系,通过对训练样本的学习训练,在三幅退化图像与原始清晰图
对高维特征集的降维是文本分类的一个主要问题。在分析现有特征降维方法的基础上,借助《知网》提出一种新的二次降维方法:采用传统的特征选择方法提取一个候选特征集合;利用《知
通过对西藏民族大学图书馆读者2016年一整年的文献借阅情况进行统计分析,深入了解读者纸质文献的阅读现状及阅读倾向,找出了当前服务中存在的问题,提出了解决问题的具体对策。