中文在线评论的产品特征与观点识别:跨领域的比较研究

来源 :管理工程学报 | 被引量 : 0次 | 上传用户:wo402179168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
产品特征及观点的识别是细粒度情感分析的重要任务。但是,现有识别算法对中文语境下不同评论领域的适应性尚无定论,算法的鲁棒性也不理想,难以实现跨领域的算法移植。为此,选取词频统计方法、规则匹配、关联规则挖掘、具有句法格式的关联规则、CRF和SVM等6种代表性的识别算法,结合中文在线评论的语言特点,对上述算法引入到中文评论的文本分析中,根据准确率、召回率和F值指标,分析比较统计方法和机器学习方法在产品特征及观点识别上的性能。选择数码相机评论、化妆品评论、书评、酒店评论、影评、手机评论和餐厅评论7类语料3646条评论,分别采用6种算法进行产品特征和观点的抽取。实验表明,不同领域下的特征抽取难度是存在差异的;不同算法适应于不同领域;评论的文本长度对识别准确率和召回率有显著影响;另外,总体上机器学习的算法性能显著高于统计学方法。
其他文献
市政工程密切关系着城市建设和人们的生活质量,对市政工程施工技术进行改善意义重大,本文即分析了市政工程施工技术通病及对策。
目的研究荨麻抗风湿活性部位的化学成分。方法运用柱色谱、制备型薄层色谱等方法对荨麻抗炎镇痛的活性部位进行分离;运用UV、IR、MS、NMR等方法进行结构鉴定。结果从活性部位
无论从学术观点还是从理论创新的角度审视,谭崇台教授主编的《发达国家发展初期与当今发展中国家经济发展比较研究》①(以下简称《比较研究》)均堪称开创性的研究成果。其学
N2O是一种重要的温室气体,大气中N2O浓度增加及其对气候变化的影响是当前关注的全球性重大环境问题。水产养殖的水体中含有大量营养盐物质,使其成为N2O的潜在释放源。近年来,
随着计算机的普及以及地理信息科学的发展,高分辨率光学卫星成像系统正越来越多的应用于遥感和摄影测量领域。这类成像系统不仅能够提供高分辨率的全色,多光谱影像,而且具有
词汇是语言中最敏感的构成部分,其中流行语又最能敏锐反映时代和社会心理的变迁。同时,随着认知学科和认知语言学的不断发展,隐喻和转喻不单纯是一种语言现象,也是人类的一种
由于铁电材料具有极好的压电﹑介电和热释电性能,以及广阔的应用前景,一直受到人们的广泛关注和重视。基于这类材料广泛和潜在的应用价值,对铁电体的理论研究具有重要的学术意
一、背景和目的心肌梗死是导致死亡和失去健康生命调整年的主要原因之一。当前心肌梗死治疗的主要方式是通过溶栓和血管成形术迅速恢复梗死心脏的血液供应,这些均显著减少了
本文根据近几年来绥化市的鱼病发生情况,就其发生原因和采取的预防和治疗措施,阐述了如何能更好的进行鱼病的预防和治疗,以及实施健康养殖的技术措施。
科学和社会的不断发展带来很多新的现象和问题,经典的数学模型及其分析方法表现出滞后和不足。一方面,这促使一些原本不被熟知的数学理论及描述方法被引入到各个应用领域中,另一