负面新闻判定算法的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:Ratawo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
负面新闻对银行、风险投资公司等机构具有重要参考价值,但是现有通用搜索引擎一般都不提供负面新闻筛选功能;而人工筛选相关主题负面新闻,效率低、工作量大,不能满足应用需求。高效而准确地自动检索、识别与特定主题(词)相关负面新闻,具有很好的理论意义和应用价值。本文在大量分析、研究负面新闻网页语料文本特征的基础上,提出了一种融合依存语法及简化的格语法,结合情感词典进行关键句群语义倾向识别,进而识别负面新闻的方法。通过对该方法进行实现,并应用到实际系统中,验证了方法的有效性。论文的具体工作和贡献如下:1.提出了一种实用的关键句群提取方法。该方法依据加权图和统计的思想,过滤网页新闻中的文本噪声,来提取与主题关键字相关的关键句,作为文本情感分析的原始语料。2.基于依存语法及简化的格语法理论,提出了一种利用HowNet情感词典进行关键句群语义倾向识别,进而识别负面新闻的方法。3.基于开源项目FudanNLP中文语言处理分析工具包,对本文所提出的关键句群提取方法以及负面新闻识别方法,在目标原型系统“负面新闻自动检索系统(Negative News Automatic Retrieval System, NNARS)"中进行了实现。本文除了参与系统总体设计外,主要具体负责以下功能模块的实现:1)可在后台定时调用主流新闻检索引擎,根据关键词抓取相关新闻网页;2)从新闻网页自动提取原始预料--新闻主题及内容文本;3)利用基于本文方法所实现的核心算法,针对原始新闻预料进行倾向筛选识别。4.对本文算法进行了实验,实验结果及原型系统的初步应用,验证了本文核心算法及所完成系统的可用性。
其他文献
内部控制对企业经济发展起着决定性作用。在内部控制中,控制制度越健全,控制效果就越好,企业运营就越有保障。本文从内部控制制度的存在意义入手,对内部控制制度的方式作详细分析
数学思想方法是对数学知识和方法形成的规律性的理性认识,是数学的一种指导思想和普遍适用的方法,更是学生形成良好数学认知结构的前提.它蕴含于知识发生、发展和应用的过程之中
义务教育课程标准明确提出,“人人学有价值(的)数学;人人都能获得必需的数学”;普通高中数学课程标准又强调了高中数学课程要“认识数学的科学价值、文化价值”,要“有助于认识数学
数学本无“大”“小”之分,但是因为人们观察数学时视野的大小,就产生了“大视野”下的数学,即本文所说的“大数学”.
新医改的实施使医院的发展面临新的挑战,为了切实增强自身实力,需对医院内部财务进行有效控制,通过提升经营利润的方式提高自身核心竞争力,从而在繁杂的医疗行业中占据主体地
为研究新一轮课程改革对高考的影响,探讨课改与高考的互动关系,全面推进课改和高考双发展,应广大教师要求,《中学生物学》特定于2006年3月第一个周末召开“中国生物高考研究与应
在传统的学科分类中,数学一直被列为自然科学的一个门类.在文献编辑和科技管理中,数学也被划在理科和自然科学的系列里.在社会文化心理层面,人们对这种数学归属于自然科学的做法已
本试验研究了饲料脂肪和胆碱水平对吉富罗非鱼(Genetic Improvement of Farmed Tilapai,GIFT,Oreochromis niloticus)幼鱼生长性能、血液生化指标、血清抗氧化指标和肝脏脂肪
叙事医学在2011年正式进入我国以来,得到迅速发展。医学领域兴起的以患者为中心的医疗、医患共同决策、关系性医学,以及文学领域的疾病叙事、叙事学等共同促成了叙事医学的产
进入21世纪以来,随着世界多极化、经济全球化的深入发展,跨文化交流日益频繁,各种文化不断融合、交汇,历史的与现实的,本土的与外来的,进步与落后的,积极的和颓废的,他们相互