利用博客链接平台选取联合关键字的博客聚类方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:quchaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对全文本关键字检索的时间成本高、采用标签/类别会产生语句歧义和同义词等问题,提出在博客链接平台上选取联合关键字进行博客聚类。假设一个博客文章被查询的候选关键字(或者联合关键字)可以用于表示这个博客文章的主题,为验证该假设,首先将跟踪代码嵌入到博客链接(BC)组件中,以收集读者查询的关键字;然后,选取适当的候选关键字作为联合关键字;最后,使用重叠投影、交互信息投影、分布式分布信息和肯德尔τ系数这四种相似性度量以验证BC组件提取的联合关键字。实验结果表明,提出的方法可以为查询者提供一条找到对应博客的快速通道
其他文献
数学离不开相等和不等。从其意义来说,这是两个既统一又对立的概念,没有相等就无所谓不等,没有不等也无所谓相等。它们之间有着内在的、本质的、密切的联系,在某种条件下可以相互
本文以案例为切入点,对企业利用合作项目收益认定进行利润操纵的方法进行分析,同时提出审计对策,以进一步遏制企业利润操纵行为。 Based on the case study, this paper ana
2011年是“十二五”开局之年,也是山东省潍坊市知识产权工作显著提升之年。在潍坊市委、市政府的正确领导下,在国家知识产权局和山东省知识产权局的大力支持下,潍坊市知识产权局
由于尚未建立起公认的古史史料学合理概念,对于古史的许多重要事实和相关问题现无法给出确定的认识。从古史史料学概念建设的角度看,顾颉刚早年提出的"层累说"之最重要的意义是
在更简句法非移位理论的间接许可(indirect Licensing,IL)以及语法功能层(GF tier)取代逻辑式LF作为句法—语义界面的基础上,对wh-问句的非连续依靠(discontinuous dependency)进行了
为进一步规范多功能护理液注册产品标准技术要求,以提高多功能护理液产品的安全性、有效性,分析多功能护理液国家标准与国外此类产品技术要求的差异,结合文章作者实际工作经
在构建和谐社会、实践科学发展观和建设社会主义新农村的大背景下,处于弱势地位的农户希望通过高等教育改变子女社会地位的愿望相当迫切。当前,农户子女上大学的经济承受能力弱
目前海上风电已由近岸向远海方向发展。常规的GPS-RTK技术虽然定位精度能够达到厘米级,但却无法满足超过其信号覆盖范围以外区域。星站差分GPS既具有接近传统RTK测量定位精度
粤东客家族群中流传着一种古老的民俗仪式——"安龙转火"。根据客家习俗,无论是新祠落成,还是旧祠重光,都需要重新将龙神和香火引入宗祠供奉,这就是"安龙转火"仪式,而要完成这一
就任务型教学法的含义,理论框架,设计原则及其在实际中的运用做逐一的论述。