微博短文本情感分析关键技术研究与实现

被引量 : 7次 | 上传用户:johnwangjohn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的兴起以及微博自媒体时代的到来,互联网上每天能产生数以亿计的博文。海量的微博文数据蕴含了丰富的有关个人、社会、企业、政府多维度、多层次、多样化的信息。对博文进行内容分析,监控网络舆情,完成对博文中蕴含的情感倾向性的分析等,有重要的理论研究价值和应用价值。本文基于模拟用户登录方式采集海量微博数据,通过分词、词性标注、主题词提取等自然语言处理技术,结合情感词库和微博语料,通过构建向量空间模型,并动态调整情感影响因子的权重等参数,对微博数据进行情感分析。本文所做的工作如下:首先,基于模拟浏览器技术,结合HttpWatch8.5抓包分析技术,采集海量微博信息。第二,基于隐马尔可夫模型和N-Gram语言模型,设计实现了中文分词器SkyLightAnalyzer,主要功能包括分词、词性标注、词义消歧、未登录词识别等。第三,基于统计和规则相结的算法,在前述中文分词器的基础上,实现了针对博文的主题词提取与情感单元提取。第四,提出基于向量空间模型和动态调整情感影响因子的权重算法,设计并实现了基于博主个性化建模与内容分析的情感倾向性分析方法。实验与实用表明了本文提出的算法的有效性。文中也对存在的不足以及下一步的工作计划进行了说明。
其他文献
<正> 每天早晨6点钟起床,第一件事不是洗漱,而是坐在电脑前,打开网络,进入K12“班主任论坛”。妻子在厨房弄早点,女儿还在熟睡之中,而我则通过看似冷漠的电脑屏幕与天南海北
期刊
<正>没有人能真正审判一个纯粹的理想主义者,但是苏格拉底却意外地自愿接受审判。这场意外,自古及今,在无数的推测里变成传奇,人们由最初的惊讶渐渐变为后来的神往,而这一切
<正>"人民是音乐的真正创作者,而艺术家只不过是把它改编成乐曲而已。"1804年6月1日,格林卡生于俄国斯摩棱斯克省叶尔宁县诺沃斯帕镇的一个地主家庭。自幼受到良好的音乐教育
农业政策性金融在促进农业发展方面发挥了重要作用。本文通过对美国农业政策性金融机构的职能定位、业务范围、资金运作和风险控制等进行研究,为中国农业发展银行的改革提供
<正>随着我国经济建设的不断发展,人们的生活方式、价值取向等受到来自不同方面不同程度的干扰和影响,党员的思想认识、理想信念、组织观念、纪律观念等也产生了一定的波动,
微生物与人类的生活密切相关,它包括细菌、病毒、真菌等,既有对人们有益的也有给人们健康造成危害的。微生物涉及人们的日常饮食、医药等很多领域,因此人们对微生物的重视程度越
《一个镘头引发的血案》在表达其原创的主动性的同时,也再现了俚俗狂欢文化自由度的趋向——在上与下的交流同构中寻觅最佳契合点,延续“大话”的方式,以更激进的“恶搞”操
20世纪70年代,德国功能学派翻译理论将交际理论引入翻译学,重视翻译的交际功能,将翻译从关注源语文本的意义转向关注目标语文本读者的接受功能。言语交际理论对凯瑟琳娜·赖
针对汽轮发电机转子平衡装备和装配条件相对稳定的特点,假定每台转子装配完成后,其测试条件、轴承刚度等都不变,则可以认为同一种型号的转子装配完后,其振动响应是相同的,即
本文介绍了我国烧结,球团目前的装备情况和主要技术指标,至1989年止,我国有烧结球团设备213台(座)、总面积10156.5m~2、总生产能力93.956Mt,1989年烧结利用系数为1.378t,(m~3