【摘 要】
:
意见挖掘是指针对主观性文本自动获取有用的意见信息和知识。汉语意见挖掘技术的研究需要汉语意见型主观性文本标注语料库的支持。由于汉语意见型主观性文本标注语料库包含了
论文部分内容阅读
意见挖掘是指针对主观性文本自动获取有用的意见信息和知识。汉语意见挖掘技术的研究需要汉语意见型主观性文本标注语料库的支持。由于汉语意见型主观性文本标注语料库包含了分词、词性、依存关系、语义、词概念、意见等大量信息,最后完成的标注通常比较复杂。为了减轻标注人员的负担,提高标注的效率和精确度,减少标注的错误率,有必要开发一款自动标注工具协助标注人员的工作。本文实现了一个基于主动学习的汉语意见元素标注工具,可以自动识别句子中的主题、情感和意见持有者等意见元素。主动学习算法具有需要训练样例较少,受不平衡训练样例干扰较小,分类性能较好等特点。本文经过实验,证明了主动学习算法应用于意见元素识别的有效性,并提出了一个公式,综合主动学习分类器F值、训练时间、训练样例数量三个方面,对系统的总体性能进行衡量。
其他文献
增强现实是虚拟现实中的一项前沿技术。随着视觉相关的前沿技术的发展和相机,投影仪等硬件设备的成本越来越低,基于投影仪相机的系统将会带来很多其他显示设备所不具备的乐趣
网格计算是高性能计算的一种方式,是近年来兴起的热门信息技术之一,它结合了传统的分布式计算,高性能计算等多种计算方式于一体。网格计算将网络上空余的多台计算机转化为自
随着多媒体技术和网络组播技术的飞速发展,越来越多的内容提供商选择组播作为多媒体内容的发布平台,而在组播环境下的数字产品的版权保护问题也变得越来越尖锐,组播数字指纹技术
BP神经网络是当前获得最广泛应用的神经网络模型之一,但其也存在固有的缺点,例如收敛速度慢、易陷入局部极小、网络结构难以确定等,这些缺点受到越来越多的科研学者的高度重
近年来,软件业的信息化、网络化、智能化的发展非常迅速,这也使得基于嵌入式系统的开发技术取得了一定的进步与发展,因此嵌入式应用系统也已慢慢渗透到我们的生活和生产的各
随着Web2.0技术的蓬勃发展,互联网上产生了海量的用户评论信息,如何从这些评论中挖掘出有价值的信息,越来越受到研究者们的关注。从产品评论中挖掘意见信息,一方面可以帮助用
伴随着Web服务技术的不断普及和发展,互联网的应用范围内迅速出现了众多基于不同平台和语言开发的WebService。基于WebService的SOA已成为企业计算新的发展方向,企业服务总线
文件系统这一概念由来已久,近些年来随着嵌入式系统技术的不断发展,在嵌入式应用中对文件进行操作已经产生了巨大的需求。国外对嵌入式文件系统的研究早已开始,并取得了丰硕
本文全面总结了目前制造业领域的研究现状,以逆向工程的基本理论、应用领域为基础,对复杂曲面模具三维重建的全过程和关键技术进行分析。根据国内现有模具管理的现状和发展情
本文论述了制造执行系统的相关研究背景、研究意义以及国内外的研究现状,对制造执行系统的相关理论进行了阐述,并对基于ERP/MES/PCS的现代企业生产管理信息自动化系统进行了