论文部分内容阅读
抑郁症是人类社会所面临的最为普遍的心理问题之一。2012年,世界卫生组织估计,全球受到抑郁症困扰的人口超过3亿。由于社会经验较少、心理承受能力较低,而又负担着未来家庭、社会的多重责任高校学生成为最容易遭遇抑郁症问题的群体之一。本文的研究目的,是探索一种自动识别方法,通过对微博社交网络用户在线信息的深度挖掘,识别出早期的抑郁症倾向的患者。本文研究的主要内容包括:首先,分析新浪微博中有抑郁倾向用户的基本特征。本文以微博用户的公开数据为基础,对有抑郁倾向用户和无抑郁倾向用户的语言、行为等方面的特征进行对比分析,用人工标注的方式获得142个有抑郁倾向用户和274个正常用户,并抓取了他们的个人资料和微博信息。对比了两类用户在语言、行为等方面的差异;确认了关键词词频、表情符号频率为分类识别的重要特征。其次,建立微博中有抑郁倾向用户分类识别模型。使用分析得到的特征,建立将用户分为“有抑郁倾向”和“无抑郁倾向”两类的机器学习模型;构建了DBN、BP网络、SVM三种分类器进行对比分析,得出最优的分类器模型,同时使用的训练样本对有抑郁倾向用户进行识别,验证模型的有效性。最后,高校学生微博用户中抑郁症问题实证研究。本文基于得到的分类识别模型,人工获取了1502个某高校大学生微博用户,调查和分析该群体中抑郁症问题的基本状况,并进行了具体描述和分析,在此基础上提出对高校管理的建议。