基于文本信息的社会关系分析与研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户：newlifeinsydney

【摘要】

：

目前,随着互联网的发展,大量的信息被呈现在我们面前。社交网络起源于网络交友,人们使用社交网络服务来组织、维护现有的社会关系,发现新的社会关系,从而在网络上呈现自己,并

【作者】

：

王中卿

【出处】

：

苏州大学

【发表日期】

：

2016年01期

【关键词】

：

社会关系分析群组分析属性抽取矩阵分解概率图模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前,随着互联网的发展,大量的信息被呈现在我们面前。社交网络起源于网络交友,人们使用社交网络服务来组织、维护现有的社会关系,发现新的社会关系,从而在网络上呈现自己,并进行相关的社交活动。人与人之间的最简单的社会关系为好友关系。除了好友关系之外,人们还可以根据兴趣和个人属性被区分为不同的群组。比如根据兴趣,人们可以被分为爱好书籍的和爱好跳舞的群组等。另外,根据对于某一事物的专业程度,人们又可以被分为专业人士和普通大众。因此,识别人与人之间的两大类社会关系,即好友关系和群组关系,将是本文的研究的两个主要方面。传统的针对社交网络的研究通常会基于用户之间的联系进行分析,但是很多用户之间并没有足够多的联系用来帮助分析。而用户发表的文本信息在很多情况下能够有效的帮助分析社会关系,比如从文本中能找出有相近爱好或者相近写作风格的用户群组。因此,本文主要将研究基于文本信息的用户间好友和群组关系分析。除此之外,从文本中抽取的用户的个人属性信息能够很好的帮助识别社会关系,因此,本文的另一个研究重点就是从文本中有效的抽取有代表性的个人属性信息。本文主要利用文本信息进行用户社会关系分析,并开展了以下几方面的研究内容：1.我们从简历文本中抽取用户的两类重要的信息来反映用户的基本属性。一类是用户的技能的信息,但是,单纯通过技能信息来描述一个用户又会显得过于简单,因此我们从简历文本中抽取文本摘要信息作为另一类信息,从而更全面地体现用户信息。为了抽取用户的技能和简历信息,我们提出了一个联合预测因子图模型,用来将不同用户与技能通过多种关系联系起来。具体来说,我们提出的因子图模型通过属性函数利用多种文本信息,而基于因子函数将不同的用户联系起来。并利用置信传播算法学习与抽取用户的技能和摘要信息。2.在获取了用户的个人属性信息之后,我们从用户发表的文本中抽取的多种文本信息帮助好友关系预测任务。由于好友关系和兴趣是高度相关的,比如相互联系的好友倾向于有相近的兴趣,我们抽取了多种情感信息来联系有相近兴趣的用户。另外,好友之间的写作风格也会类似,因此,我们抽取了多种写作风格特征,比如,文本结构特征,词法特征,句法与篇章特征来帮助预测好友关系。我们最终基于概率图模型融合上述信息并进行用户好友关系的学习与预测。3.由于区分用户群组有很多种标准,我们分别按照兴趣与专业程度对用户的群组进行区分。值得注意的是,用户之间可能会有多个共同的兴趣群组,而一个用户只可能是专业的或者非专业的。对于基于兴趣的群组推荐,由于同一个用户可能存在多个兴趣群组,而不同群组之间也可能存在关联,因此我们提出了一种新的隐含因子图模型,用来有效的集成表层与潜在的文本与社交信息,从而将用户与群组有效的集成在一起。而对于区分专业和非专业人群,由于专业人士和非专业人士的关注点通常是不同的,而评论的专业程度通常和语言的表达有关。同时,对于同一事物的评论,不同类型的评论者也是有关联的。因此,我们提出一种基于协同矩阵分解的框架,用来预测用户发表评论的专业程度,并结合了多种文本特征与评论之间的联系。目前,用户社会关系分析研究尚处于起步阶段,本文研究亦属探索性工作,上述工作对用户社会关系分析在理论、资源、计算上均有不同程度的创新,对该领域的相关研究具有重要参考价值。

其他文献

天中传统地域文化动漫化的发展策略研究——以驻马店市为例

随着我国第三产业的迅猛发展,传统文化产业作为绿色的高附加值产业,日益受到各地域城市的重视及关注。日本作为动漫大国,有其浓郁的地域文化风格,能将动漫作品推出国门,走向

期刊

驻马店天中传统文化动漫化动漫产业

两种稠环修饰核苷的合成

本文设计并合成了两种稠环修饰构象限制核苷,对这两种构象限制核苷的合成方法做了详细的探讨,并对它们的结构进行了LC-MS、1H NMR和X-射线晶体衍射等表征。论文第一部分介绍

学位

构象限制稠环核苷13-偶极环加成反应反义寡核苷酸构象分析

探析明代宫廷帝王肖像画的表现特征

<正>传统宫廷帝王肖像画是以各朝代帝王形象为主体的绘画,在画面表现上,各个时期呈现出不同的特征。明代宫廷帝王肖像画是在隋唐、五代、宋元基础上的延续与发展,并展现出具

期刊

肖像画帝王形象画面表现写实性明代宫廷

论遗传学教学中的几对矛盾

<正> 遗传学的教学同其他课程一样,会遇到一对一对的矛盾。怎样认识和解决这些矛盾,将直接影响课程的教学质量。现就遗传学教学中的几对矛盾提出一些肤浅的看法。一、基础知

期刊

经典实验现代技术分子遗传学现代遗传学孟德尔教学与实验

超敏C反应蛋白测定在恶性肿瘤诊断中的意义

目的探讨超敏C反应蛋白(highsensitivityC-reactiveprotein,hs-CRP)在恶性肿瘤诊断中的临床应用价值。方法应用免疫速率散射比浊法测定治疗前的253例恶性肿瘤、99例良性肿瘤

期刊

超敏C反应蛋白肿瘤炎症

语块教学对英语写作能力影响的实验研究

语块的缺乏是英语写作的困难之一。笔者以语块教学理论和语言信息加工理论为基础,从加强学生语块教学的角度,对如何提高学生的写作能力进行了实证研究。研究结果表明:语块能

期刊

语块提高英语写作能力实证研究

论天中文化

天中文化是介于黄河与长江之间的一种区域文化,它内涵丰富而又独具特色,作为中原文化的重要组成部分,它在中华文明史上产生过深远的影响。

期刊

天中天中文化中原文化

C反应蛋白测定在恶性肿瘤诊断中的价值

目的探究C反应蛋白(C-Reactive Protein,CRP)测定在恶性肿瘤诊断中的价值。方法本次研究就选择对象共80例,其中我院2013年6月—2014年6月收治的恶性肿瘤患者、良性肿瘤患者和

期刊

C反应蛋白恶性肿瘤临床诊断

网络广告课程教学改革研究

互联网广告的迅猛发展对中国广告人才市场需求是一个巨大的转变,越来越多公司需要通过网络拓展市场范围,国内高校的广告专业也有相应的网络广告课程的开设。本文以网络广告设

期刊

网络广告课程实训教学改革

天中之“中” “中”在中兴

按：文化基因是社会生产力的原生秉性。人类历史上，每一次先进社会生产力的大解放大发展，都是在吸纳先进文化营养之后的蓬勃兴起。在特定历史时期，先进文化对于社会生产力的解放发

报纸

基于文本信息的社会关系分析与研究

与本文相关的学术论文