基于CNN的汉语解释性意见句识别方法研究与实现

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:joshua5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着一系列网络平台的出现,网络上产生了大量由用户生成的汉语意见文本。网上评论信息数量巨大,用户希望能够了解评价产生的原因,而商家也希望能够获取更多信息来帮助自己改进,解释性意见句识别就是为了适应这一需求而产生的,也是为进一步的解释性意见挖掘作铺垫。本文面向汉语产品领域及服务领域的评价信息。具体来说,本文的工作主要分为以下三个方面:(1)解释性意见句语料库构建:本文针对手机和酒店两个领域的汉语评价信息,分别构建解释性意见句语料库。制定详细的标注规范,对语料库进行统计分析,对比产品领域和服务领域的语料特点,并分析在两个领域下解释性意见句识别效果不同的原因。(2)基于CNN的解释性意见句识别方法:解释性意见句识别的工作任务就是从意见信息中识别出含有解释性意见的句子,即对意见句进行二分类。本文采用卷积神经网络和最大熵的两种方法进行识别,首先对卷积神经网络的框架进行详细的介绍,然后在CNN框架下对可能影响CNN分类效果的因素分别进行实验,采用不同窗口大小、不同池化方法等,选出效果最好的一组参数与最大熵方法进行对比,最终实验结果表明,CNN能够更好的解决汉语解释性意见句识别问题。(3)解释性意见句识别系统实现:本文利用CNN训练解释性意见句识别模型,分别应用于手机和酒店领域。构建解释性意见句识别系统,并对系统进行了测试。实验结果表明,基于CNN的汉语解释性意见句识别系统具有更优的性能。
其他文献
随着互联网的发展,信息井喷式的增长以及网络的迅速普及,搜索引擎和个性化推荐系统成为人们获取信息最流行的两个工具。然而当部分信息难以简单描述或用户难以精确描述自己的
随着传感器技术的发展,多传感器图像数据类型和数量急剧丰富,图像融合技术在军事、遥感、计算机视觉、医学图像处理等领域得到了广泛应用,更成为了国内外研究的热点。近年来,
在海量数据环境中,个性化推荐系统成为了帮助用户发现自己感兴趣的物品或信息的利器,在很大程度上节约了用户在寻找物品或信息时的时间和精力。另一方面,随着数据量的飞速增
与其他生物特征识别技术相比,人脸识别具有更加方便、友好以及直接的特点,是模式识别领域的研究热点之一。虽然人脸识别已经广泛地投入到了实际应用中,但姿态、表情、遮挡物
随着信息技术的不断发展,如何处理信息数据成为当下研究的热点。而压缩感知理论突破了香农采样定理,为信息处理提供了一个新的发展方向。但是信号量不断的增大,给压缩感知的
银杏(Ginkgo biloba L.)是银杏科银杏属的孑遗植物,是我国重要的经济树种。类黄酮(flavonoids)是一类低分子量的多酚化合物,是银杏中重要的次生代谢产物,具有多种生物学功能。类黄酮的生物合成过程较为复杂,其受到内外多种因素的影响,随着对类黄酮研究的不断深入,发现MYB转录因子在类黄酮转录调控方面发挥着重要作用。目前,已在多个物种中鉴定到调控类黄酮合成的MYB转录因子,而银杏中的
近年来,基于溶液加工工艺的小分子有机电致发光材料及器件的研究日益受到重视,一方面是由于溶液加工工艺相对蒸镀工艺在制备大面积器件时具有明显的成本优势;另一方面,是因为
随着我国道路基础设施建设的不断发展,道路建设取得了举世闻名的成就,与此同时,沥青路面病害对道路服务水平造成了一定影响,作为主要病害形式之一的路面开裂等问题,一直受到各国学者的重视。为了探究外界降雨、地下水等对沥青混合料抗裂性能的影响,本文利用试验方法研究干湿循环对沥青混合料断裂模式的影响规律。为了准确评价沥青混合料在干湿循环作用后不同断裂模式下的变化规律,采用非对称半圆弯曲试验对沥青混合料的应力强
现有研究关于知识溢出对于集群创新是起到推动作用还是阻碍作用的争议较为复杂。而默认知识溢出具有的无意识性,是导致知识溢出对创新产生负效应的根本原因。为了区别于前人
近年来,高校教师发展成为高等教育领域探讨的热点话题。英国一直以来高度重视高校教师发展问题,将其置于重要发展地位。英国从步入高等教育大众化以来,先后涌现了一些旨在促进高校教师发展的组织机构,经过漫长的发展阶段,逐渐形成了内外联动的系统化的高校教师发展组织体系,包括国家层面的政府组织、社会层面的中介组织和院校层面的校本组织。本研究共分为四个部分。首先,第一章为绪论,具体介绍了该课题的研究背景及意义、研