【摘 要】
:
博客聚类是处理博客信息的有效方法,提出基于评论修正的博客页面聚类算法.首先分析博客所包含的信息层次结构,然后利用博客页面的通用属性构建博客属性模型,基于博客属性模型
论文部分内容阅读
博客聚类是处理博客信息的有效方法,提出基于评论修正的博客页面聚类算法.首先分析博客所包含的信息层次结构,然后利用博客页面的通用属性构建博客属性模型,基于博客属性模型对博客页面进行聚类,并且在初次聚类的基础上利用博文的评论对聚类结果进行修正.采用通用的熵和纯净度来衡量聚类结果,根据评论利用方式的不同,设计了两种实验方案:一个实验直接使用评论参与聚类,另一个将评论作为聚类后的修正手段.实验结果对比表明,在大多数情况下,利用评论作为修正手段的聚类效果要优于直接利用评论参与聚类.
其他文献
目前的服务匹配采用语义匹配的方法,实现对原子级的简单服务匹配,随着服务内部的逻辑越来越复杂,出现了大粒度的服务,以行为描述服务的复杂业务逻辑,现有的匹配算法无法适应
针对微铣削加工过程中的温度难以准确测量和精准控制的问题,主要从温度的角度出发建立了有限元数值分析模型.选取ALE自适应网格技术和热-机耦合方法,按照实际情况合理设置所
为统一跨组织之间的服务流程定制问题,提出了基于高级Petri网的动态服务流程模型混合分割方法,将一个全局的BPEL模型分割为若干个完备的执行分片,根据组织的不同,分别放置在
针对PCA-神经网络预测方法解决预测问题时,忽视数据自相关性而造成的预测结果难以满足实际工程要求精度的研究现状,建立了预测数据的增广矩阵.通过计算前l时刻数据确定增广矩
用数值试验方法分析了破坏过程中FRP板中的应力传递过程,即从FRP承担拉应力起,到应力增大直至最后失去承载力.通过对粘贴不同FRP板长度对于加固后结构的力学性能的影响的分析
直接交换面积的定义一般涉及4~6重积分,采用直接积分算法计算时耗费大量的机时,使段法模型应用受到很大的制约.利用积分数学运算公式,推导了基于积分降重法的辐射直接交换面积
目前流行的滤波方法卡尔曼滤波方法、小波处理方法不能处理非白噪声.针对噪声由白噪声和非白能量有限噪声组成情况,H∞优化滤波器考虑了非白能量有限噪声的最坏情况,但未顾及
依据离散单元方法,应用DEM仿真软件对转载过程进行计算机仿真.针对当前采用DEM方法尚不能做到微小颗粒的计算,通过对颗粒粒度为75,100,150 mm的对比计算,得出颗粒粒度在50~30
采用高温固相法,在800℃不同热处理时间合成了具有钙钛矿型的钒掺杂的含钛高炉渣催化剂(vanadium oxide modifie dtitanium-bearing blast furnace slag,VTBBFS).用X射线衍射(XR
农药是农业生产中必不可少的生产资料,但是随着农药的大量的使用,我国当前的农药污染状况不容乐观,本文综述了农药对大气、土壤、水体的污染情况及对人体健康的危害。