基于未登录词识别的微博评价短语抽取方法

来源 :计算机应用与软件 | 被引量 : 4次 | 上传用户:LUOMINGGANG818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于微博内容话题分散,识别博文评论对象是微博情感分析研究的热点和难点。研究表明未登录词识别是导致评价短语识别率低的重要原因之一。针对这种情况,提出一种基于文本词序列的词频、凝聚度、左右自由度等统计特征学习未登录词识别模型的方法。实验结果表明,将自动识别的微博文本中的未登录词加入基于CRFs的评价短语识别算法后,显著地提高了评价短语识别的准确率和召回率。未登录词的学习算法直接利用评价短语识别的标注样本,具有较强的可行性。
其他文献
介绍一种新的等距离采样参数归一化方法。针对美尔倒谱系数(MFCC)和一阶、二阶美尔倒谱系数,提出了一种新的学习矢量量化(LVQ1)和改进学习矢量量化(LVQ2)结合的识别算法。仿真结果表明所提出的算法相对于只用LVQ1网络识别,可以有效改善学习效率。
论坛类的网页已成为网络上十分重要的信息来源。种类繁多的论坛网页能够为我们提供大量有价值的参考信息,这已成为人们日常生活中不可或缺的一部分。然而,论坛网页上的很多信息是干扰信息,例如包含大量不同类别的文章,一些广告文章等内容,使用户的使用体验大大降低。因此,对论坛数据的分类是快速获取信息的方法。本文主要对论坛上的这些不同的文章进行分类。通过对文章内容进行分词,提取关键字,相似度计算等,以达到文本分类
~~初孕妇女无痛人工流产术110例临床分析@王素华$天津市宁河县芦台医院!天津301500 @杨会珍$天津市宁河县芦台医院!天津301500~~~~
期刊
~~
目的:探讨病理性黄疸对新生儿听力的影响。方法:选取2014年1月至2015年12月期间某院收治的200例病理性黄疸患儿作为本次研究的对象。根据这些患儿血清胆红素的水平将其分为轻度
病毒病是朝天椒的常发性病害,发生普遍,防治困难,危害严重。发病后常全株受害,一般减产10%~30%,严重时可减产50%~80%,甚至绝收,已成为朝天椒高产稳产的主要制约因素口。近几年的大田试验和
通过对城市"新废墟"现象、固化的"改造审美风格"以及当下城市更新运动的一些探讨和反思,试图重新审视在改造设计项目中的"新"与"旧"的二元辩证关系。结合对吴悦石艺术馆的设
本文报道了九连小檗细胞悬浮培养过程中细胞生长与酯酶同工酶变化的关系。分析了25代及第10代和第25代不同生长时期的细胞和培养液的酯酶同工酶。结果表明,各代第18天的酯酶
现代化战争是技术装备和先进武器等综合实力的对抗。为了能够使指挥人员更好的进行作战规划和制定决策,通常在实战演习之前需要对目标作战进行推演,通过可视化的方式来展现战
本文对林奈木(Linnaea borealis L.)进行了解剖研究,证实林奈木系多年生小灌木,绝非半灌木。同时也弄清了该植物茎不能增粗和对高寒山区适应的原因。
目的:考察中药化合物组释放动力学新理论在银翘解毒片释放特征评价中的适用性。方法:以Kalman滤波法为基础,进行紫外分光光度法测定银翘解毒片化合物组标准谱、线性、精密度、