基于微博的抑郁倾向人群用户画像构建

来源 :吉林大学 | 被引量 : 0次 | 上传用户:jqh_0727
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:社交网络的发展为抑郁倾向人群的情感倾诉提供了新的途径。本文以新浪微博为社交媒体代表,通过构建微博抑郁倾向用户的画像模型,挖掘当前社交网络中该人群的语言内容和情绪特点,可视化展示该人群在社交媒体中的典型特征,为利用互联网技术实现抑郁症患者的早期识别提供参考。材料与方法:以用户画像视角入手,从个体维度、时间维度、内容维度和情感维度四个方面构建微博抑郁倾向人群的CUTE模型。利用文献调研法梳理研究现状、网络爬虫法获取社交媒体平台数据、数据挖掘法对抑郁倾向用户的博文文本进行内容和情感分析,最后采用可视化的方式将该人群的语言特征和行为特点进行画像展示,实现对该人群社交媒体特征的全面分析和语义挖掘。结果:研究结果发现,在微博社交网络平台中,抑郁倾向用户主要以女性居多,该人群倾向于注册新的微博账号作为情绪抒发的树洞,在日常发文的表述中常伴有极端且悲观的情感宣泄,且夜间是该人群负面情绪抒发的高峰期。博文话题主要包括人生哲学思考、睡眠状况描述、负面情绪宣泄、正面情绪表达和抑郁症的治疗五个主题内容,博文表达具有一定的社交网络语言风格,该文本特征是利用社交媒体识别抑郁症患者的重要标志。结论:在以往研究的基础上,从用户画像视角出发,将医学信息学与精神心理学理论知识相结合,制定了更为严格的社交媒体中抑郁倾向用户纳排标准。从个体维度、时间维度、内容维度和情感维度四个方面对微博抑郁倾向人群构建用户画像模型,更加全面直观地展示了这一群体的多维特征,为利用社交媒体平台识别和发现抑郁倾向用户提供了重要依据。
其他文献
大数据全球化已成为主流时代,随着其技术、产业、应用等方面不断升级,所产生的数据信息日益级数化增长。针对大数据存储量大、类别繁多、解决效率快、价值密度低等特点,引入张量模型对其进行有效表示和高效分析,进而处理与挖掘其复杂的潜在关联。但是随着张量规模的快速增加,其占据更多的内存空间和消耗更多的计算时间,继而出现了“维度灾难”问题。为了降低维度灾难计算的复杂性,高阶张量模型采用张量链分解为多个相互串联且
生活品质的提高使得牛肉需求量增加的同时其品质也日益受到重视。对湘西黄牛而言,其育肥方式和品种改良等方面已有所研究、原料肉的分级也已有参考标准,但月龄对其肉品质的影响尚无系统性的研究。本试验以特定的饲养条件为背景,用安格斯牛最长肌做为参照,通过对6、18及30月龄的湘西黄牛背最长肌营养、食用与加工品质,脂肪酸及风味品质的对比分析,研究湘西黄牛不同月龄间以及湘西黄牛与国际优良品种间肉品质的差异,揭示湘
目的:本实验以宫颈癌Hela细胞为研究对象,分析天花粉蛋白(TCS)对Hela细胞中miR-1290表达?继而对Hela细胞EMT的影响。方法:(1)实时定量PCR技术验证TCS对miR-1290表达的影响是否与芯片结果一致;(2)Transwell技术用于检测miR-1290表达对宫颈癌Hela细胞迁移和侵袭能力的影响;(3)Western blot检测miR-1290对上皮间质转化(EMT)相
近年来,光催化技术蓬勃发展,有望解决当前严峻的能源危机和环境污染问题。类石墨相氮化碳(g-C3N4)因其较好的可见光响应、成本低、易制备以及稳定性好等优点,在可见光催化领域引起了研究者的广泛关注。然而,单独的g-C3N4仍存在光生电荷难分离以及光量子利用率差等缺点,这极大抑制了其光催化活性。针对此问题,本论文以g-C3N4为基础,通过对其进行表面改性并且负载适当的助催化剂,制备了三种不同的g-C3
随着信息技术的高速发展,各行各业对带宽的需求越来越高。因为香农极限定理限制着基于单模光纤的光通信网络容量上限,迫切需求革命性的新技术解决当前网络容量挑战。一种以少模光纤为传播媒介的模分复用技术应运而生,该技术采用相互正交的空间模式作为互不影响的传播通道,能够提高光通信系统容量。然而,少模光纤中独有的损伤特性如模式相关损耗、模式耦合、差分模式群时延会影响模分复用技术的传输能力,降低模分复用系统的传输
新能源电动汽车的发展对动力电池的能量密度有了更高的要求,目前商用的锂离子电池受其正极材料的制约,能量密度已达到极限值。开发更高能量密度的电池体系是未来动力电池的发展方向。锂硫电池作为新一代二次电池拥有超高的理论能量密度。为解决其穿梭效应引起的容量快速衰减的问题,在隔膜上修饰一层功能性中间层材料来阻挡多硫化物向负极扩散是简单而行之有效的方法。本文从修饰隔膜的中间层材料角度出发,研究了隔膜中间层材料及
电能是目前人们生产生活中使用最广泛的能源之一。随着社会发展和科技水平的进步,配电规模的逐步增大,降低线损消耗,实现绿色低碳的配网发展是供电企业迫切需求。线损是衡量供电企业经营管理水平的指标之一,也是制定科学合理的降损措施的重要依据。但是,目前在供电企业常用的三种线损率计算方法依然存在着不能全面、系统地反映线损的情况,比如由于受到电网运营需要及电能计量自动化水平的限制,电力企业月度供电量和售电量的统
目的:基于问题解决情境理论,探讨个体特性、健康风险认知水平对问题解决相关变量以及对信息搜寻行为的影响及作用路径,了解健康风险信息搜寻用户的心理认知特性以及信息搜寻过程中的心理认知因素间的相互作用机制,阐释信息搜寻行为的内在机理,为面向情境大数据建模及其用户行为预测提供理论依据。方法:在对相关文献总结梳理基础上,探讨信息搜寻过程中的心理认知因素,构建健康风险信息搜寻行为的认知因素理论关系模型,提出相
目的:了解ICU患者医院感染多重耐药细菌种类分布、来源分布及耐药情况,分析其产生的相关危险因素,以便加强多重耐药菌监控和抗菌药物应用管理,为临床合理用药提供依据,并提出有效的预防措施。方法:(1)回顾性收集2014年6月-2017年6月期间我院ICU病房所有送检病原菌结果符合医院感染多重耐药的病原菌检验资料,统计并分析所有医院感染多重耐药病原菌种类分布构成、病原菌标本来源分布及病原菌耐药情况。(2
随着5G的正式商用,“万物互联”的时代即将到来,为了应对未来网络持续爆炸增长的移动终端数量,以及指数级倍增的数据流量,密集化部署接入节点的超密集异构蜂窝网络(Ultra-dense networks,UDN)是未来移动通信网络的关键技术之一。超密集异构蜂窝网络通常由大量的低功耗、低成本的微小基站组成,其部署密度远远超过现阶段的移动通信网络,具有优化频谱效率、提升小区用户覆盖率和布设自由度高等优点。