基于情感分析的新闻浏览平台关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luther2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络对传统出版物和媒体的冲击,用户对于新闻浏览习惯发生了改变,越来越多的人养成了每天在网络上浏览新闻的习惯。本文研究如何高效、准确地从海量的新闻和新闻评论中找到网络读者感兴趣的信息。本文首先对新闻聚类问题进行研究,希望根据新闻包含的事件更好地对新闻进行组织。在将新闻聚类定义为结合多种不同特征的文本聚类问题的基础上,本文使用两种经典聚类方法,K均值聚类和合并层次聚类在新闻聚类问题上进行尝试,并提出基于狄利克雷过程的聚类方法。在此基础上,本文将这三种聚类方法推广到使用多种不同特征的情况下,并提出了可同时使用多种特征的狄利克雷过程集聚类方法。本文将新闻聚类中情感目标候选的提取问题定义为新闻聚类中高频命名实体的抽取问题,并提出了适用于语篇的快速命名实体抽取方法。同时,本文提出将新闻中的命名实体作为一种新的特征辅助新闻聚类的方法。在获得情感目标候选的基础上,本文提出应用依存句法信息对新闻评论进行情感目标相关的情感分析的方法,并给出了基于规则的和基于统计的两种情感目标相关的情感分析方法,从而可以按照评论的情感和情感针对的目标对其进行组织并提供给用户。实验证明本文提出的新闻聚类方法和情感目标相关的情感分析提高了任务的精度,有效地完成了本文提出的任务。
其他文献
随着全球一体化的不断发展,学术研究不能闭门造车,需要与国外的学术界互相交流。但作为非英语为母语的英文学术论文写作者,经常会遇到一个英文句子该怎样表达才能让国外同行
近年来,随着金融、传感器网络、股票分析、气象监测等领域的不断发展,一种流动的无限的数据引起了数据库界的广泛关注,从而使数据流管理技术成为当前的研究热点。根据数据流
随着人们日益增长的个性化需求,通用搜索引擎显然已经不能满足用户的各方面需求,由于主题式搜索引擎具有效率高、专业化、目标化、准确性高、及时性、个性化等优势,能够得到越来
强化学习是一种重要的机器学习方法,其特点是通过感知环境状态信息来学习动态系统的最优策略,通过试错法不断与环境交互来改善自己的行为,并且对环境的先验知识要求很低。多Agen
随着计算机技术和网络技术的飞速发展,计算机网络带给人们的好处数不胜数,因此人民群众对信息网络的依赖性越来越强。但是有很多是敏感信息,甚至是国家机密将不可避免地吸引
随着无线通信、集成电路和嵌入式计算等技术的高速发展,由大量低功耗、多功能的微型传感器节点构成的无线传感器网络得到广泛应用,并引起科研人员的极大关注。为此,本文研究
学位
随着互联网上的信息量越来越大,传统的通用搜索引擎对信息的查找、索引越发显得力不从心,逐渐显露出“准确性差、时效性差、覆盖率低”等弊端。通用搜索引擎立意于满足用户的
无线多媒体传感器网络是一种追求感知信息类型多样化的新型传感器网络,通过使用多媒体传感器节点,它能采集音频、视频、图像等多媒体信息。由于存在多种类型的数据分组,MAC协议
近年来,随着在线社会网络的不断发展和计算机系统处理能力的不断提高,社会网络分析和挖掘成为热门的研究领域。大部分对社会网络的研究集中在只有正链接的网络,本文研究对象