基于语句-词条矩阵的聚簇式动态增长聚类算法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:liongliong543
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web信息在以指数级的速度增长,然而传统搜索引擎的检索方式难以使用户找到精简而准确的信息.为此该文提出了一种基于语句-词条矩阵的聚簇式动态增长聚类算法.该平面分割的算法的整个工作过程有3个步骤:预处理Web数据,进行文本摘取和过滤处理;形成每个文档的语句-词条矩阵,构成若干文档的矩阵集合;通过聚簇式动态增长聚类算法,对相似文档进行聚类.对该算法进行了实验分析.结果表明,该算法在保持文档语义联系的同时,其对文档的聚类有较高的准确性.
其他文献
随着课堂教学实践方法的不断丰富,英语教学实践活动也面临着新的发展和变化,在英语教学实践过程中,教师对学生听说读写能力进行全面的培养,在学生的思维拓展能力培养上,情感
民国时期的留学西洋的画家滕白也,并没有投入到当时西方艺术的大潮流中,而是保持自己清醒的头脑,充分肯定中国艺术的基础上,鼓励中国艺术家坚持走中国本位的艺术,并对西方现
影母字在曲阳方言中与普通话一样,在四呼前今读音都可以是零声母。影母字在开口呼前绝大部分今读音为疑母[?]。疑母字在曲阳方言开口呼字前依旧读疑母[?],在其它三呼前今读都
云冈石窟中的乐器图像种类数量繁多,这些拿着乐器的乐伎们反映了当时人民向往的无忧欢乐的佛国景象,也再现了北魏时期的音乐文化。这些乐伎人的雕刻,对后人研究中国古代音乐
在现有的一台蒸发镀膜机基础上,设计加工了一个双热舟化学气相沉积系统.该系统具有真空度高、升温速度快、源和衬底温度可分别控制等优点,有利于化合物半导体纳米材料的生长.
研究了用手性修饰剂(1S,2S)-(-)-1,2-二苯基乙二胺修饰的负载型钌催化剂(Ru/γ-Al2O3)催化芳香酮的不对称加氢反应,在KOH的异丙醇溶液中,10~20℃,=5MPa条件下,芳香酮及其衍生
应用Yethiraj的加权密度近似泛函理论研究平板狭缝中方阱链流体的密度分布,系统的Helmholtz自由能泛函分为理想气体的贡献利剩余贡献两部分,其中剩余贡献部分分别采用刘洪来
采用x射线粉末衍射方法测量了不同温度下R(Fe,Mo)12化合物(R=Nd,Y,Dy)的晶格常数,对沿不同轴向的热膨胀反常程度进行了计算.分析认为R(Fe,Mo)12化合物热膨胀反常主要取决于Fe
采用光子与电子(反电子)相互作用的最小电磁耦合模型,对"光子单圈图传播子与链图传播子"在动量重整化方案中的"有限量"的通常解析计算方法--Feynman高维收敛积分计算方法作了
聚苯胺颗粒结构对其电学、光学性能有很大的影响.本文首次在10T强磁场的作用下用化学氧化溶液原位聚合法得到聚苯胺并观察充分聚合后聚苯胺的颗粒结构、形貌牲.强磁场作用下