基于HowNet的中文语义倾向性分析技术研究

被引量 : 0次 | 上传用户:police
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机理解人类的情感是人工智能的最高境界,对文本进行正面、负面的语义倾向性分析是基础,也是目前富有挑战性的工作。在Web2.0时代,海量的网络评论蕴涵着很多有价值的信息,为及时、自动、智能、准确地发现这些信息,迫切需要应用语义倾向性分析技术来解决这一问题。语义倾向性分析目前最大的价值在于从某一个主题的评论中分析得出总结性的结果,这首先涉及到从互联网上获取大量的评论数据,可行的策略是使用并行技术。并行网页获取技术已经得到深入研究,但是研究集中在为通用搜索引擎的网页搜集部分服务,目标一般是全球的网页。针对一个主题的评论通常集中在一些站点,网页也呈现高度结构化。因此针对这样的应用,本文设计了动态任务分配模型来并行下载网络评论。基于关系数据库和豆瓣网的实现证明了该模型的蜘蛛设计简单、对运行蜘蛛的机器要求低、可伸缩性好。该模型同样可以用于垂直搜索引擎的网页搜集部分。语义倾向性分析离不开情感知识库,而中文研究中目前尚无一个完善的情感词典。HowNet虽然提供了相当数量的情感词,但在本文的语义倾向性分析中尚不能直接应用。因此本文研究了基于HowNet的情感词典的构建。在篇章的语义倾向性分析方面,本文认为语言学的知识、规则可以用来提高统计学习算法的效果,因而基于情感词典,提出了属性加权的统计学习算法来进行篇章的情感分析,增强情感词在文本倾向性分类中的贡献,具体实现了属性加权的朴素贝叶斯和属性加权的评分算法。针对中文网络评论的语义倾向性分析实验结果表明:属性加权的统计学习算法改进了倾向性分类的效果。
其他文献
随着基于内容的图像检索技术的发展,包含“交互系统”和“用户参与”的相关反馈构架,在缩减高层语义概念与低层视觉特征之间的‘语义鸿沟’方面体现了较好的性能。特别是基于
目的应用血清皮质醇(cortisol Cor),24h尿蛋白定量及中医证候积分等指标,评价滋阴清热法对足量糖皮质激素(glucocorticoid, GC)治疗肾病综合征(nephrotie syndrome, NS)过程
经济全球化的加快,使得国内的金融市场也日益复杂和多样化,金融风险的度量相关模式呈现出非线性、非对称以及尾部相关等特征.原有的基于正态分布假设的线性相关系数分析方法
薄弱学校是一个国家或地区教育系统中的“短板”。薄弱学校的存在,是教育不公平的表现,也是教育发展不均衡的结果。消除薄弱学校,促进教育公平和教育均衡发展,是当今世界各国
湖北省博物馆珍藏了湖北省天门市邓家湾遗址出土的石家河文化陶塑动物。陶塑动物种类甚多,以狗、象、鸡和长尾鸟的数量最多。在距今4000多年前的新石器石家河文化时代,条件艰苦
中层管理者在组织中扮演着非常重要的角色。从中层管理者在组织层级中所处的位置以及当前中国企业的内部环境来看,中层管理者所处的情境具有高度不确定的特点。在这样的情境
中介行业在现代经济的运行中处于重要的位置,它对于促进中介市场的交易以及中介市场的规范,起到了良好的作用。随着社会经济的信息化趋势越来越明显,中介行业也受到了强烈的
在国外,有关组织政治知觉的实证研究已经取得丰硕成果。但是在中国,组织政治知觉的研究才刚刚起步。而中国经过两千多年传统官僚政治的影响,社会政治权力高度集中,稀缺资源高
万维网中信息量的迅速增加使得用户很难访问所需的信息。作为下一代网络,语义网旨在利用机器可读的元数据使用户更加方便地访问网络中的信息。近年来,本体作为领域知识一种共
本文介绍了网格的基本概念,体系结构和国内外研究现状;分析了在网格系统中引入经济理论的可行性。本文的主要研究内容在于网格资源分配和定价策略。文中以经济学中的双向拍卖