基于多维语义关系的谐音双关语识别模型

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:aa654518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谐音双关语的识别是幽默研究领域的一个重要分支,并逐渐发展为一个新兴的研究领域.本文提出一种基于4个维度特征集的谐音双关语识别模型,其中4个维度包括语义透明度、语义相关度、语音扩展性和语法特征集.语义透明度包括词项统计和语句字符长度两个特征,语法特征集包括人名、大写、时态、词性和位置5个特征.将这4个维度的9个特征加入到二叉判定树中,使用K-Means聚类获取阈值,完成双关语的识别.本文的实验数据来自于SemEval2017任务7的语料,取得了较好的效果, F1值高于参赛队中的第一名,实验证明基于4个维度特征的二叉判定树分类方法在谐音双关语识别中是有效的,并且在多个特征中,语音扩展性和语法特征集的效果比较明显,这也符合谐音双关语识别中语音作用较大的预测.
其他文献
<正>今年两会期间,央视开设《两会大数据》栏目,共播出九期节目,分别是《两会脉搏全球跳动》、《搜寻两会最热话题:百姓心中的难和易》、《政府工作报告:谁在看?看什么?》、
<正> 生漆已有数千年的使用历史,但对它进行全面系统的研究只是近几十年才开始的。近年来,随着科学技术的发展,分离、分析手段的提高,生漆化学的研究进展非常迅速,在生漆全成
期刊
本文首先论述煤炭企业安全成本的定义和内容,其次对煤炭企业安全成本核算体系进行了分析与设计,包括安全成本的科目设计、安全成本的数据收集及处理、安全成本的财务报告等内
<正>2011年10月16—18日我有幸参加了在呼和浩特举办的全国中小学班主任经验交流座谈会。回想两天的培训,我的收获颇丰。专家言谈,闪烁着智慧的结晶,精辟、独到的见解令人折
研究泰国对中国的认知转变:1948-1991年泰国的中国研究,目的是分析泰国的中国研究如何解释中国对泰国的政策,以及这些解释如何影响泰国对中国的认知是"威胁"还是"友好"。研究
随着新课程的实施,语言训练有被削弱的严重倾向,这不利于全面提高学生的语文素养。本文结合新课标的精神,阐述了语言训练在小学语文教学中的重要地位,并对阅读教学中如何实施
目的 :探讨女性外阴黑色素瘤的治疗方式和治疗效果。方法 :195 5年 1月~ 1997年 12月复旦大学肿瘤医院和苏州大学附属第二医院共收治外阴恶性肿瘤 5 5 0例 ,外阴黑色素瘤 38例
随着经济水平的快速提升,银行的发展变得越来越快,银行作为重要的金融机构,在现代化社会的发展过程中占据重要的地位。为了积极发挥银行的作用,需要加强银行内部控制。本文对
表观遗传学是指DNA序列变化以外的可遗传的基因表达改变,这种影响基因转录活性而不涉及DNA序列改变的基因表达调控方式称为表观转录调控,组蛋白乙酰化修饰是基因表观转录调控
战时日本对外政策制定主要分为两种决策运作模式临机性合议决策模式和内面性指导决策模式。在前者的运作过程中,陆、海军、外务省,都不具有对外政策的最终决定权,他们对外交