客户负面新闻自动检索方法的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yexj585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金融机构的风险评估部门通常需要利用互联网搜索引擎,在网络上搜索自己所关注客户的负面新闻报道,以便尽早发现风险,为风险评估部门做出决策提供有益的辅助信息。手工方法完成这项工作效率低、工作量大。负面新闻属于情感文本,研究针对互联网情感文本的自动检索及识别,具有重要意义和实用价值。本文在深入研究当今情感倾向性识别技术的基础上,提出了两个算法:1)基于倾向词搭配的情感倾向性识别(Emotional Tendentiousness Recognition based on Tendency Word Collocation, ETRTWC)算法;2)基于语境框架的负面新闻抽取(Negative News Extraction based on Context Framework, NNECF)算法。使用ETRTWC算法判断客户新闻的情感倾向性,将新闻分成正面、中立和负面三类,并得出客户综合打分结果;使用NNECF算法从新闻集中抽取负面新闻,并与ETRTWC算法识别出的负面情感类新闻取交集,共同抽取负面新闻集。本文的主要工作和贡献如下:1.提出两种情感及负面新闻识别算法,即ETRTWC算法和NNECF算法。ETRTWC算法从情感倾向词着手,提出给单个倾向词分配四个属性,然后通过依存句法结合打分规则得出整个句子的情感值,最后得出整篇新闻的情感值。NNECF算法针对每个单一语境负面新闻集合来定义语境框架,通过构建语境框架库和框架词汇层次库,结合相应的中文自然语言处理技术和对数线性模型理论,判断待识别的句子是否属于某一框架,进而判定其是否是负面新闻。2.设计并实现了一套客户负面新闻自动检索系统(Customer Negative News Retrieval System Automatically,CNNRSA)。该系统采用B/S架构,以本文提出的负面新闻识别算法为核心,并利用复旦大学自然语言处理系统(FNLP)进行中文句子分词处理、词性标注和句子依存关系分析。CNNRSA具有互联网新闻抓取、新闻情感初步分类、负面新闻抽取,以及新闻入库、查询和检索等主要功能模块。3.对ETRTW C算法和NNECF算法进行测试,验证了算法的有效性;以“诺基亚”为客户关键词对系统进行了测试,验证了系统的可用性和有效性。CNNRSA主要模块开发现已基本完成,系统可正常运行。
其他文献
我国建筑能耗约占全国社会商品总能耗的27%,其中北方采暖建筑是冬季能耗的主要部分,采用监测技术研究我国北方居住建筑在采暖期的围护结构耗热量随时间变化特性对提高居住建
数字信号处理技术和低功耗技术是近年末涡街流量计研究的热点。数字信号处理算法一般通过DSP实现,计算结果准确、测量精度高。但是,DSP功耗大,无法做到低功耗和两线制。现有的低功耗、两线制仪表一般采用常规的信号处理方式,方法简单,测量精度比较差。针对数字信号处理与低功耗之间的矛盾,为了满足一些工业现场对两线制电流传输的要求,研制了一种基于MSP430F1611单片机的低功耗、两线制涡街流量计数字信号处
混合磁路电机是二十世纪八、九十年代从永磁同步电机发展起来的一种新型电机。它具有电励磁电机调磁方便且调磁容量小和永磁同步电机效率高,密度大,高可靠性等优点,具有广泛的推
网络控制系统(Networked Control System,NCS)是近年来重要而热门的研究课题,它在交通运输,医疗卫生,航空航天和现代通讯等领域有广泛的应用和广阔的应用前景。控制理论和调
本课题以上海光源工程为背景,对直线加速器冷却水系统中换热器的控制系统进行研究。通过综合运用控制理论,设计调节载热体流量的控制器来控制换热器出口水的温度,达到高精度温度
随着信息技术的发展,远程监控系统越来越引起人们的关注,在工业控制领域,针对远程监控系统的研究也正如火如荼地展开着。而随着工业自动化程度的提高,人们对远程监控系统也提出了
本文针对工业过程控制中普遍存在的非线性现象,提出把微分几何理论中的精确线性化方法应用于工业过程控制中,使工业过程控制中的非线性系统完全精确线性化解耦或部分精确线性化
本文首先介绍了随机微分方程的背景知识及其理论解的重要性质。其中通过随机积分导出了Ito型和Stratonovich型两种重要形式的随机微分方程,并给出了计算随机积分期望的相关引
70年代提出的细分控制较好的解决了电机在开环控制下常常出现的低频振动,运行时输出力矩下降,定位精度受电机自身影响等问题。本文以三相混合式步进电机为控制对象,在分析了细分控制原理的基础上,数字化实现了步进电机的步距角细分控制。首先分析了步进电机在细分状态下的磁场特点,步进电机在通入正弦阶梯电流时的离散磁场与永磁同步电机的连续磁场有相似之处。从步进电机的结构和运行原理出发,在一定的假设条件下,步进电机
电力系统目前存在着上千种通信协议,不同厂商开发的设备所支持的协议几乎各不相同。而在一个变电站中要用到不同厂商的设备,这些设备之间进行通信就必须进行协议转换,即增加复杂