基于社交网络的用户性格与行为分析

被引量 : 5次 | 上传用户:caoyi1014
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近两年社交网络如雨后春笋般出现,国内比较知名的有人人网、微博、QQ空间等,国外则有Facebook、Twitter等。社交网络越来越多的改变着人们的生活方式以及社交方式,人们逐渐接受并习惯在社交网络上发照片、写日志、更新状态。另一方面,用户在社交网络上的表现也趋于差异化,例如,有些人喜欢只浏览而不发表内容,另一些人喜欢发表日志却很少发照片。用户的这些行为并不是杂乱无章的,而是蕴含着一定的规律,如何有效的分析用户的行为,挖掘行为背后的深层次规律,进而给用户提供个性化的服务成为一大难点。目前,基于社交网络的用户行为分析主要集中在用户的行为数据上,没有充分挖掘用户在社交网络内发表的文本内容,如用户的状态和日志等,另一方面,目前的用户分析也没有涉及到用户的性格模型,如果能找到用户的性格和行为之间的内在联系,必然能够为社交网络的用户分析提供新的理论支持。本文的工作主要包括以下几个方面:1.分析方法的确定。首先探讨了目前国内社交网络的发展以及社交网络用户数据的获取,然后以人人网为研究对象,选取了通过构建人人网站内应用的方式获取用户的数据,站内应用的形式为基于人人网的在线性格测试。2.站内应用的构建。性格测试的题目选择了大五性格测试量表,利用正态分布,将每种性格成分的成绩平均分成五个档次,根据用户所在档次对用户进行测试反馈,并采用Flex前端、Java后台、MySQL数据库技术进行实现。该站内应用通过OAuth认证获得用户的授权,然后通过API读取用户的个人资料及UGC数据。3.用户数据的处理。对站内应用记录的用户的个人资料、UGC数据进行量化,得到用户的行为统计数据,主要包括用户发表状态、日志,或者分享日志、相册等的频率。此外,对用户的UGC进行语义分析,首先对用户的状态、日志等进行分词以及词频统计、然后对不同的词进行权重调整,最后利用主成分分析简化所得数据。基于以上步骤得到的用户的行为数据以及语义数据,应用线性回归和决策树算法,对用户的性别、年龄、性格成分进行预测,将预测结果与已知记录进行比较,验证算法的有效性。
其他文献
介绍了以面向对象技术为基础的软件设计模式的基本概念及分类,描述了各种设计模式之间的关系,讨论了使用设计模式的正确方法,并结合实例介绍了多种设计模式在教学信息平台开
为了分析养殖刀鲚体内与生长环境菌群结构,利用PCR—DGGE技术,对养殖刀鲚鳃、胃、肠壁及肠内容物和养殖水体菌群结构进行了初步分析。PCR—DGGE指纹图谱分离显示,42条清晰条带,其
目的观察生脉温胆汤治疗慢性肺源性心脏病(以下简称肺心病)急性期的临床疗效。方法将104例肺心病急性期患者随机分为2组,对照组52例给予常规西医治疗,治疗组52例在对照组治疗基础
岭南建筑是中国传统建筑的一大特色。文章首先分析岭南古村落的总体布局特征;接着探讨典型岭南民居的气候设计经验,具体梳理了竹筒屋、西关大屋、骑楼和围龙屋的布局特点和建
在人性化设计理念的指导下,借金冠嘉华住宅小区设计经验,总结小区总体规划、建筑设计、节能措施等方面所体现的人性化基本要求。
<正>从一家不足100平米的汽车维修店,到在全国拥有700多家连锁店,小拇指是如何做到的?从去年开始,中国汽车后市场步入快速发展期,成为当下的创业风口之一。在车后市场中,连锁
人体皮肤吸收途径有三条 :角质层、汗腺管口、毛囊皮脂腺口 ,西医多采用透皮增强剂促使药物穿透皮肤 ,而中医在透皮治疗中常采用芳香开窍、活血化瘀类中药 ,有利于皮肤吸收。
志意在《灵枢》中有重要理论意义和临床价值。为了更好地对其继承和发扬 ,试从能强志意的刺五加的药理和临床 ,对其进行探讨 ,提出志意与调节作用、免疫功能等有关 ,可能主要
对南京2005-2008年、2010年和2012年气象数据进行统计分析,在统计时间段内共发生高温热浪13次,其中有强降温及以上的高温热浪发生6次。在高温热浪期间突然强降温天气过程中高
<正>什么样的企业能登上新三板?挂牌过程中有哪些误区?怎样选择合适的中介机构?我们邀请业内人士,对这些问题一一作答。依法设立且存续满两年挂牌新三板的条件新三板挂牌条件