面向搜索引擎查询日志的凝聚式聚类算法的改进

来源 :中国人工智能学会第12届全国学术年会 | 被引量 : 0次 | 上传用户:fulinbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,信息爆炸式增长,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向。本文分析了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及两种在其基础上的改进算法,然后分别指出了三个算法中的错误和产生错误的原因。最后,我们给出了本文的改进算法,并通过模拟实验对几种不同的算法进行了对比。
其他文献
目的 为合理利用流行性乙型脑炎 (乙脑 )灭活疫苗和减毒活疫苗各自的优点 ,降低预防接种反应的发生率 ,提高免疫学效果 ,开展了乙脑灭活疫苗与减毒活疫苗相结合的免疫策略研
本研究通过显示的构造一个非线性的映射函数,设计了一种新的非线性支持向量机(SVM)分类器学习算法。该算法可以被理解为一种特殊的正则化网络,对它的训练仅需要一个求解一个
强化学习是机器学习研究的重要方向之一,它可以通过和环境交互来学习马尔科夫决策过程(MDP)问题中的最优策略。部分感知马尔科夫决策过程(POMDP)模型引入了隐藏状态,是状态不
会议
在决策表中,任意一个属性都可以看成是论域上的一个等价关系,而等价关系可以用矩阵来表示。本文鉴于矩阵运算具有简便直观的特点,基于矩阵运算设计了一个求正域的算法。首先
由中华医学会航空航天医学分会主办的全国第六次航空航天医学学术会议将于 2 0 0 2年 6月 2 6~2 9日在浙江宁波市召开。本次会议共收到应征论文 2 1 9篇 ,经专家评审组采用双
海洋基础数据集元数据挖掘可归结为海洋调查information资料数据表的表头数据项的挖掘问题,频繁挖掘可以作为海洋数据集元数据挖掘的主要方法之一。本文研究了海洋基础数据集
本研究针对一类带未知定常参数和未知时变参数的二阶非线性系统,基于Lyapunov稳定性理论和Backstepping技术,提出了组合自适应迭代学习控制方案。充分利用时域和迭代域的信息
会议
关联分类具有较高的分类精度和较强的适应性,然而由于分类器是由一组高置信度的规则构成,有时会存在过度拟合问题。本文提出了新的规则评价方法,它综合考虑规则的置信度和支
FCV算法和NCA算法是两种典型的基于扩张矩阵归纳规则的覆盖算法。前者采用“≠”作为选择子的关系运算符,给出了求解最大复合问题的近似算法;后者采用“=”作为关系运算符。本