基于潜语义模型的跨媒体信息检索与文本情感分析

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:wwwdps1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜语义模型已经被应用到跨语言信息检索、图像标注与检索以及文本情感分析等多个领域。本文提出了Multitype-LDA模型和CTS-LDA模型,Multitype-LDA模型可实现跨语言、跨媒体的信息检索,而CTS-LDA模型可以对网络评论做深入的情感分析。本文的主要工作和贡献有:   ①提出Multitype-LDA模型来处理包含多种类型的“词”的文档集,这些词可以是不同语种的词,或者是不同的媒体特征(如图像中的SIFT特征、color-patch特征等),也可以是媒体特征与文本词。通过计算不同种类型的“词”之间的共现关系,Multitype-LDA模型可以确定不同语言或媒体之间的语义联系,从而实现跨语言、跨媒体的文档标注和检索。   ②提出了基于Multitype-LDA模型的图像标注和图像检索方法。Multitype-LDA模型可以实现文本对图像的自动标注。线性地联结文档模型和Multitype-LDA模型,可以实现一种基于语义的图像检索的方法。实验证明了Multitype-LDA模型在图像标注和图像检索中的有效性。   ③提出了Multitype-LDA跨语言信息检索模型,根据不同语种的词之间的共现关系,确定不同语种之间的语义关系,并根据不同语种的语义联系实现跨语言的信息检索。实验表明,Multitype-LDA跨语言信息检索模型具有较好的跨语言信息检索性能。Multitype-LDA跨语言信息检索模型可以处理大规模的数据集。   ④提出了TS-LDA模型来进行话题情感分析,TS-LDA模型能够同时确定评论所涉及的话题及每一话题的情感倾向。   ⑤为了有效利用评论集中的专家观点和一般用户观点,在TS-LDA模型的基础上提出了CTS-LDA模型,即概念话题-情感LDA模型。CTS-LDA模型将专家观点看作是概念,而将一般户观点看作是话题,能够很好地结合专家观点和一般用户观点,可以同时确定评论所涉及的概念或话题以及这些概念或话题的情感倾向。实验表明,CTS-LDA模型很适合做网络评论情感分析。   ⑥本文还开发了一个产品评论在线分析的雏形系统CTS。CTS系统用CTS-LDA模型来做评论集的情感分析,用语义网技术建立知识库来储存和查询模型计算结果,并以图形界面显示分析结果。   总的说来,本文针对潜语义模型在跨媒体信息检索与情感分析的应用研究中作了有益的探索。
其他文献
近代工业逐渐向大型、集团化发展,一些大型、高能和高速的工艺和设施越来越多,各类工程系统的复杂性大大增加,工业生产领域中低概率重大事件的事故发生频率相对明显增加,系统的可
水下传感器网络系统集成了无线传感器网络与水下机器人技术的优势,为解决水环境监测、水下探测等领域面临的监测数据有效实时回收问题提供了新思路。但是,水声通信的诸多限制使
学位
在公路交通快速发展的时代,疲劳驾驶已成为引发交通事故的主要原因。因此,如何快速、准确的识别驾驶员的疲劳状态已成为世界各国研究的热点。而机器视觉理论及其在人脸检测领域
受现代军事技术发展的客观环境的影响,在信息化条件下的战争,对精确打击提出了更高的要求。如何提高弹箭武器射击精度已成为愈发重要的课题。研究通过判断待打击目标的具体位
学位
语音合成技术是人机语音通信的重要组成部分,基于此开发的产品涉及到人类生产生活的很多方面。随着信息化程度的提高,国际交流的频繁尤其是互联网的发展,不同语言之间的交流越发
学位
现代交流伺服技术是电机学、电力电子学、微电子学、计算机科学、自动控制理论等多种学科的结合和交叉应用的产物,对推动着社会的进步和生活水平的提高发挥着重要的作用。在交
随着计算机和媒体技术的不断发展与进步,用软件编码逐步代替硬件板卡编码来对节目信号进行采集成为了可能。使用软件编码的采集系统不仅可以提高工作效率,而且也可以降低采集系
腹膜透析是治疗急性肾衰、慢性肾衰和尿毒症等肾衰竭疾病的重要手段。腹膜透析(Peritoneal Dialysis,PD)的基本原理是利用腹膜作为透析膜,将透析液引入腹腔内,通过腹腔中腹膜毛细
无线传感器网络(Wireless Sensor Network)综合了微电子技术、嵌入式计算技术、现代网络及无线通信技术、分布式信息处理技术等先进技术,能够协同地实时监测、感知和采集网络覆