面向搜索的微博短文本语义建模方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:sdwtb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博中包含大量具有时间、用户等信息的短文本数据,通过挖掘其语义信息来实现精准搜索已受到广泛关注.将传统的主题模型应用于微博短文本语义建模时通常会存在以下问题.一方面,微博的短文本会引起语义稀疏性;另一方面,由于传统的主题模型仅建模文档之间的信息,不能充分挖掘文档内部的上下文信息,因此其仅能捕获全局语义.针对以上问题,文中提出了面向搜索的微博短文本语义建模方法,该方法包含三部分:基于词向量的短文本扩展算法、基于扩展的微博主题模型和微博搜索.首先,所提扩展算法以具有局部语义的词向量为基础,通过计算单词间相似度
其他文献
[目的]通过SD大鼠急性经口、亚慢性经口毒性试验和组合的诱变试验,确定戊唑醇原药SD大鼠急性经口LD50、亚慢性毒性作用特征与主要的毒作用部位,阐明戊唑醇原药的诱变性,为戊
目的研究舌下神经管的形态结构及与其毗邻骨性结构的解剖关系,为临床诊断和手术治疗提供解剖学依据。方法采用20例干性颅底标本和15例干性寰椎标本及15例头颈湿性标本CT薄层扫
In this research ceramic pigments have been synthesized with crystalline spinel structure and chromium based with a stoichiometry ACr2O4. A was an element with
稽留流产属于临床上一类自然流产的特殊类型,主要是指胚胎死亡后滞留在宫腔内,尚未自然排出的现象。临床学者认为,对于稽留流产患者要及时终止妊娠,尽快排出死胎。目前,临床
针对机器人工位设备和动作复杂化以及设备布局和机器人运动轨迹相互影响所引起的传统串行设计 流程难以满足工位精准化设计要求的问题,分析了6R机器人的正逆运动学理论,构建
传统造型艺术以形状与线条、色彩与构图、材质与肌理等表达语言建构独特的时空关系,以强烈的物质属性区别于其他艺术形式。而在新媒介环境中,数字化的生存模式消除了原有的物
目的评价间隔寡核苷酸分型(Spoligotyping)及多位点可变数量串联重复序列分析(MLVA)两种分型方法在甘肃省结核病分子流行病学中的应用,初步探索甘肃省结核分枝杆菌的基因型及
主题:“QQ农场”和“Defense of Hidgeon”的可玩性比较分析11月28日上午,华中师范大学信息管理学院教授吴建华作了以“‘QQ农场’和‘Defense of Hidgeon’的可玩性比较分析”
目的 通过比较乳腺影像学报告及数据系统(BI-RADS)诊断标准与超声弹性成像(UE)改良5分法判断乳腺肿物良恶性的诊断价值,期望为乳腺超声检查的诊断思路提供依据.方法 对手术病理证
目的探讨采用玻璃体腔内注射雷珠单抗联合激光治疗新生血管性青光眼的临床效果。方法61例新生血管性青光眼患者,按照治疗方法不同分为观察组(40例)和对照组(21例),对照组采用