社会网络新媒体的信息获取与情感分类关键技术研究及实现

被引量 : 3次 | 上传用户:mena
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分类是利用计算机对文本进行情感倾向性分类,利用文本情感分类可以对网络中舆情进行预测,可以对商业产品进行优缺点分析,甚至在网上用户行为挖掘中也可以加入情感分类的内容。近年来,随着网络技术的发展和成熟,网络从以计算机为中心转变到以网络用户为中心,用户可以在网上随意发表自己的观点评论,而微博的出现更加速了网络中用户之间的交流。大量微博评论信息充斥网络,如何有效利用这些数据服务大众,也越来越急迫。本文设计了一种基于向量空间模型的情感分类算法,利用情感句中评价对象及情感单元建立情感向量,计算出情感句的情感倾向,并得出相应的情感倾向权重值。最终设计并实现了一个微博情感分类的检索系统。本文中所做的工作如下:1)利用数据抓包工具HttpWatch对新浪微博数据交互过程进行分析,并实现了对新浪微博数据的爬取。2)对情感词典进行了筛选,并结合情感词典提出了一种评价类情感句中情感单元的抽取方法。3)利用正态分布的规律对情感词情感权重计算进行了研究,并设计实验进行了实验分析。4)在向量空间模型的基础上,提出了一种短文本情感分类算法,利用评价对象作为维度,情感单元中情感权重作为维度权值建立向量空间模型,计算得出情感句的情感类别及情感权重。最终通过实验验证了本课题提出的抽取方法和情感分类算法具有一定的科学性及可行性。
其他文献
本文立足于长江干线北斗地基增强系统示范项目的建设,依据北斗差分定位服务的模式,结合长江干线的特征和重点服务于船舶定位导航的特点,论证了长江干线北斗差分数据服务适合
组织行为学是一门行为学为基础,与心理学、社会学等学科相交叉的一门交叉性边缘学科。近年来,随着经济的发展,越来越多的企业组织认识到了它的重要性。笔者从组织行为学出发,
结合实际情况,分析当前炼油厂仪表和控制系统工程设计现状以及在发展过程中存在的问题,实施工程设计改进方案,并取得良好的经济效益和社会效益。
奥斯卡·王尔德在世界文学中的地位很大程度上得益于他的唯美主义思想,其童话作品更是被视为唯美主义的经典,是其思想和童话文体的完美结合。本文以王尔德的《快乐王子及其它
结合航运企业的人才需求特点,分析我院航海类毕业生现阶段存在的问题,探讨航海类专业人才应具备的职业素质,提出改进航海类学生职业素质培养的途径和方法。
X射线数字成像检测(Digital Radiography—DR)是一种非胶片无损检测技术。具有检测速度快、检测成本低的优点。概述了X射线数字成像检测的特点、以平板探测器为主体的X射线数
写作焦虑是学习者在写作过程中表现出来的焦虑行为,如逃避写作任务、担心自己的作文被他人评阅等,是外语写作教学过程中比较棘手的问题。本人认为,"非虚构写作"正可有效地解
308L和347L奥氏体不锈钢焊缝金属能发生氢致滞后断裂,而且比304L母材更敏感.用单边缺口试样动态充氢测出的氢致滞后断裂门槛应力强度因子KIн随可扩散氢浓度c0的对数而线性下
近几十年来,肺癌的发病率和病死率在很多国家都有明显上升的趋势,目前全世界每年有60万新发肺癌病人[1],在我国,肺癌的发病率和死亡率的上升近10多年来尤为明显,肺癌起病隐匿,出现
习近平总书记“七一”重要讲话是公立医院“两学一做”学习教育“学”的重要内容和“做”的行动指南.作为向最广大人民群众提供医疗服务的公立医院,坚持“不忘初心”,践行“