中文语义倾向识别的关键算法研究

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:winterdxm7124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文语义倾向识别是指识别某一特定主题的中文文本所具有的主观态度倾向性,判定文本对于该特定主题是持有肯定态度或是否定态度,它属于中文自然语言处理的范畴,是基于全信息的自然语言理解的重要研究领域。本文基于词汇本身的语义倾向信息,提出了一种基于词汇的语义倾向向量空间模型表示算法(SOVR算法)。该算法综合利用文本的语法、语义、语用三个层次;结合了基于统计和规则的方法;在一定程度上融合了一般领域与特定领域的信息。该算法可以用于传统机器学习算法的预处理模块,产生对文本进行全信息向量空间模型表示的输入。实验表明,与多种基于向量空间模型的机器学习方法和非向量空间模型的统计测度方法相比,该算法更加能够对文本的语义乃至语用层次的信息加以表达,能很好地处理网络中噪声较大的文本,具有良好的鲁棒性,在处理不同领域、文本差异较大的语料时也能够保持相对较好的性能,在结合C4.5决策树算法和SVM算法时分别达到90.79%和92.21%的性能。本课题为中文文本的语义倾向识别提供了一个新的行之有效的方法。
其他文献
会计电算化不仅能减轻财会人员的劳动强度,为会计工作节省大量的人力、财力和时间;同时也由于会计电算化计算手段和会计管理决策手段的现代化,既提高了会计信息收集、整理、
本文重点介绍了3G时代的中国移动客户流失管理,通过对中国移动在客户流失管理的现状分析,并结合相关理论研究,提出了有针对性的策略方案,试图为中国移动在新的竞争环境中提供
近几年来,医务人员收取药品回扣引起人们越来越多的关注,具统计2005年8月到2006年12月,全国共查处医药卫生领域商业贿赂案件979件,涉案金额达6121万元。已被刑事处理242人,党
文章就如何将玻璃钢雕塑进行青铜或紫铜色彩效果处理进行探索和研究,归纳并总结了着色处理的工艺流程,对所使用的材料及方法进行了较为详细的阐述,希望能对艺术类高校的雕塑
随着铁路大提速及客运专线的建设,使得列车的运行速度和密度不断提高,机车信号的主体化和自控化对自动闭塞设备的要求也不断的提高。ZPW-2000A移频自动闭塞设备目前在我国铁
<正>李克强总理在2014年《政府工作报告》中提到"繁荣发展哲学社会科学,倡导全民阅读"、"提供更多优秀文艺作品,倡导全民阅读,建设书香社会"。目前,阅读、写作和计算被国际社
<正>前言"滩头年画"因产地位于湖南邵阳隆回县滩头镇而得名,是现存湖南传统手工艺的代表之一,它集绘画、雕刻、印刷等艺术于一身,博采众长而又个性鲜明,自成一家,具有浓郁的
目前,锦纶染色的匀染剂大多数都是由非离子和阴离子表面活性剂复配而成的,通过与染料间的相互作用以达到匀染的目的。本文主要研究了非离子型表面活性剂1815和阴离子型分散剂
结构的安全性一直是人们关注的首要问题,而对结构破坏的有效预警则是保障人们生命财产安全的最有效措施。随着声发射技术在混凝土领域研究和应用的深入,人们逐渐认识到了声发
<正> 对有腹主动脉旁淋巴结广泛转移的睾丸精原细胞瘤病例,从前是采用大的平行的对野进行全腹放疗,要在6~7周才能给到中间平面3000rad。患者对这种疗法的耐受是差的,常有恶心