面向中文微博的观点句识别研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:wanyuequn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文微博包含了用户对热点话题的观点,对其进行观点挖掘可以实现突发事件预警、舆情监控等。目前,微博研究多数基于英文语料,中文微博观点句的挖掘大多混淆在情感挖掘中少量提及,由于中文微博特殊的语体特征,导致传统中文文本观点挖掘模型无法取得理想效果。区别于已有的情感挖掘工作,本文依据中文微博的语体特征分析结果选取特征,除了选取情感特征外,还加入主张性动词、语气词、程度副词以及固定词性结构等观点句特征,采用CRFs模型进行观点句识别研究。实验结果表明,仅选取情感特征准确率较高,但召回率仅为32.1%,而加入其他观点句特征后,召回率显著提高到61.8%。该方法应用于2012年中国计算机学会(CCF)组织的"观点句识别"测评任务中,取得了很好的效果。
其他文献
收集2019年版《广西卫生健康统计年鉴》中广西民营医院与公立医院的相关资料,采用Excel软件、文献研究法及描述性统计法,对医院数、床位数、卫生技术人员数、医疗服务情况及
目的探讨呼出气一氧化氮(FeNO)检测在支气管哮喘患者规范化治疗中的应用价值。方法选取2018年3月至2020年3月在我院住院治疗的支气管哮喘患者80例,根据指南推荐的哮喘病情严