Web论坛上的垃圾贴过滤

来源 :NDBC2009第26届中国数据库学术会议 | 被引量 : 0次 | 上传用户:new_spider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,Web论坛成为Web用户信息共享和分组合作的新平台.Web论坛上积累了海量的知识,由此成为互联网上进行数据挖掘的宝贵资源.在Web论坛上的应用常受到论坛上低质量帖子(垃圾贴)的影响.因此针对在Web论坛上进行垃圾贴过滤的问题,提出了基于隐含狄利克雷分布的CJTM和CAJTM模型,CJTM和CAJTM模型利用了论坛帖子的文本内容,帖子间的回复链接信息和作者信息,和传统的分类方法及基于规则的方法相比,CJTM和CAJTM模型不需要训练集和规则集.在实际Web论坛数据中进行的实验显示出较好的效果.
其他文献
在简要介绍城市浅层地震勘探干扰波特点的基础上 ,结合福州市活断层探测的浅层地震试验探测资料 ,阐述了抗干扰高分辨率浅层地震勘探的技术装备、地震数据采集的技术方法以及在强干扰背景条件下围绕抗干扰和提高地震资料信噪比与分辨率而采取的技术措施。试验结果表明 :采用可控震源和与其相匹配的地震仪器以及小道间距、小偏移距、多通道和高频检波器接收的工作方法 ,是实现抗干扰高分辨率浅层地震数据采集的有效途径。
为更好地设计微型直升机的控制系统,必须建立其动力学模型.以微型直升机偏航控制为例,由于微型直升机复杂的动力学特性以及直升机微型化后的特殊性,用传统建模方法很难建立出
从多层弹性介质理论模型出发 ,探讨了用加层的方式正确计算透射损失的途径。在此基础上 ,我们对某井的实际弹性参数应用了此方法 ,计算了假设介质分别为弹性情况和粘弹性情况
"05方案"的实施,将高校思想政治理论课管理工作提到了非常重要的地位。7年来,思想政治理论课"05方案"顺利实施,高校思想政治理论课管理工作取得重大成绩。管理重心有了明确调
雅鲁藏布江位于印度和欧亚大陆汇聚带内 ,其形成受到冈底斯山和喜马拉雅山差异性抬升的控制。冈底斯山抬升在先 ,发生在中生代晚期至新生代早期。一系列起源于冈底斯山和青藏
目前黑龙江省对多年冻土区的公路路基下冻土的处理措施主要是以清除为主,文中分别通过现场试验以及数值模拟计算,针对清基与否对路基产生的影响进行了分析.研究发现,对路基基
以压电堆型作动器联入桁架形成自适应结构,用Hamilton原理导出机电耦合方程. 求出了应力对电压的敏度,以输入电压作为控制量,构造了静强度控制的规划法模型. 算例验证了该方
针对受加性噪声干扰的语音信号,采用基于小波变换的Kalman滤波方法,提出一种有效的语音增强方法.分析在实际处理中所遇到的二进小波变换、滤波参数估计、Kalman滤波发散等问题.语音增强的效果采用信噪比来进行评估.仿真实验表明在加性噪声为高斯白噪声和色噪的情况下,该方法均具有较好的有效性.
From the view of both objective and subjective factors.the indoor air quality(IAQ)evaluation was considered.Carbon dioxide (CO2) and formaldehyde (HCHO) were se