【摘 要】
:
汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文
【基金项目】
:
国家自然科学基金(61573294), 国家科技支撑计划(2012BAH14F03), 教育部博士学科点基金博导类项目(20130121110040)
论文部分内容阅读
汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大熵分类模型,提出了一种最优特征模板自动抽取的隐喻识别算法,讨论了3种不同层次的特征模板,既包含了经典的简单特征,又将跨多个词的远距离上下文信息,以及描述语义信息的词语相似性引入特征模板进行考察.实验结果表明,该算法提高了隐喻识别准确率,是一种对于汉语隐喻计算行之有效的机器学习方法.
其他文献
焊接变形控制一直是业内研究的重要课题,圆钢管桁架结构因工程而异,焊接加工制作各有特点.从圆管相贯节点类型、焊接变形成因和控制焊接变形措施等方面,详细阐述了当前焊接技
针对无稳态非线性系统,提出2种线性变参数(linear parameter varying,LPV)模型辨识方法.对于线性权重LPV模型,结合高斯牛顿法和最小二乘法对局部线性模型的参数寻优;对于高斯权
主要介绍近年来关于可压缩磁流体力学(MHD)方程组的若干研究进展,主要包括:一维可压缩MHD方程组古典解的存在唯一性和剪切粘性极限,三维可压缩MHD方程组的整体解存在性和不可压