微博网站中面向主题的权威信息搜索技术研究

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:xiaocai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博信息的稀疏性和时效性,研究了微博网站中面向主题的权威信息搜索问题。通过提取微博隐主题方法,缓解了微博文本信息数据稀疏性的问题;通过两阶段聚类算法,将微博网站中的信息按主题进行聚类,加快了微博信息搜索时间;提出了一种微博网站中面向主题权威信息的排序模型,该排序模型结合KL—divergenceis言模型的伪相关反馈技术和时间因子来对微博信息进行排序,并利用第一次检索到的首页信息中转发次数较高的微博信息进行查询扩展。在新浪微博的真实数据集上的实验结果表明,提出的隐主题模型可以较好地解决微博数据稀疏性问
其他文献
研究了多视角聚类问题,由于多视角聚类考虑到每个样本在多个视角的信息后进行聚类,并利用了更多的有效信息,因而较单视角聚类算法更优。目前绝大多数多视角聚类算法在聚类过程中
针对当前需要对海量的文本数据进行分类和用于训练的带标记的文本数据非常匮乏这两个问题,结合半监督的朴素贝叶斯分类算法和Map—Reduce编程模型,提出了一种新型的并行化的半
基于数据包络分析量化的企业经营效率,以我国2008年~2014年沪深两市非金融类上市公司为样本对企业内部控制质量对其经营效率的影响进行实证分析。结果显示:上市公司的内部控制质
随着诊断技术水平的不断提高,近年来孤立性蝶窦病变的发病率有明显的提高。我科2004年1月-2005年12月共收治孤立性蝶窦病变23例,经鼻内镜手术取得良好疗效。报道如下。
企业财务审计工作的难度大,影响着企业的发展,受新企业会计准则的影响,需要优化审计工作的方法。基于此,本文将阐述新企业会计准则的相关内容,分析新企业会计准则对企业财务
由于概率维的存在,使得准确高效地处理不确定数据的Top-k查询成为一个急需解决的难题。提出了一种利用控制关系分析(dominate relationship analysis,DRA)的不确定数据Top-k尼查
目的总结显微镜下单鼻孔经蝶入路切除垂体腺瘤手术经验。方法16例垂体瘤患者采用显微镜下单鼻孔经蝶入路切除垂体腺瘤,观察手术效果和并发症。结果术后随访,MRI显示肿瘤全切
基于有限状态自动机理论,将Web服务建模成一个有限状态自动机。针对网络服务描述语言(WSDL)在服务行为描述方面的缺陷对其进行扩展,提出了从扩展的WSDL到动作时序逻辑(TLA)语言的
随着鼻内镜手术的广泛应用,传统的鼻窦炎手术术式不断地被替代,但鼻内镜手术并不能完全代替Caldwell—Luc手术,对某些上颌窦囊肿、持续性或复发性上颌窦炎疾病、上颌窦良性肿瘤
目的 探讨喉鳞癌Ki67抗原表达与临床病理特征及预后的关系。方法 采用Envision免疫组化二步法检测40例喉鳞状细胞癌标本Ki67抗原表达,同时检测5例癌旁正常组织作为对照。结果