面向认知的语言距离计算

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:love4898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生活需求趋于多元,学习成本不断提高,语言学习者希望通过一种高效的学习方式,以便在较短的时间内掌握一门语言。认知语言学理论表明“人是通过认知和理解才学会并运用语言”的,对传统的生成语言学理论提出挑战。互联网的普及带来海量数据,深度学习技术持续加热。本文将结合深度学习技术,从认知学的角度度量语言在其两个重要维度——语义和语音的距离。在人们的认知中,词汇的相近不仅仅体现在语义方面,例如“father”和“strict”在语义上的关联性并不强,但它们在很多人的认知中却联系密切。是否能用计算模型来模拟这种人们在认知层面上建立的词语距离感知模型,是面向认知的语义距离计算尝试探索的主要内容。为此,本文从人们词汇联想的角度出发构建了数据集,提出了面向认知的词汇距离计算方法,包括基于MLP和基于CNN的计算方法。在所有标记词汇定义为正例的数据划分策略中,基于MLP和CNN的计算方法的性能优于传统的余弦相似度计算方法,MLP模型平均F1值在0.7909,CNN模型则为0.7974。本文提出的基于MLP和CNN的计算方法可以较好地弥补基于大量统计文本生成的词向量和面向认知的语义距离计算方法之间的鸿沟,可以较好的模拟人们在进行词汇联想时对词语的距离感知。在语言学习中,学习者必须具有分辨相似读音的能力。对于极易混淆的读音,如“bear”与“pair”,“bell”以及“dear”等单词,在人们的口语学习中发声和辨识都是一个难点。而这种人们听觉接近的读音能否通过模型模拟出来,是面向认知的语音距离计算探索的主要内容。为此,本文从人们容易产生混淆的读音出发构建了数据集,提出了面向认知的语音距离计算方法,包括基于GRU和LSTM的双向RNN计算方法、CNN计算模型以及CNN结合LSTM计算方法。在基于编辑距离为1构造的数据集中,以上方法均取到了最好的F1值,并且CNN结合LSTM的方法效果最佳,F1值为0.8649。本文提出的面向认知的语音距离计算方法对于人们听觉上混淆音具有一定的判别能力。
其他文献
创新能力是一个企业乃至国家发展的基本动力,技术创新型企业作为国家和社会创新的主力军,发挥着越来越重要的作用。一方面,技术创新型企业不断创新,利用技术优势占据市场;另
约束满足问题是人工智能领域重要的研究方向之一,主要用于求解实际问题和学术问题。约束满足问题技术解决问题的主要思想是:首先将待求解问题抽象成一个约束网络模型,然后利
快速、准确的实时监测是保证工业过程正常、安全运行的关键。主元分析(PCA)是多元统计过程监测中最有代表性的方法之一。然而,标准的主元分析假设过程是线性的、平稳的,在应
远程计算机监测系统是在远端计算机知道并允许的情况下对其进行远程监测。它被广泛的应用于办公、教育等领域,具有很好的现实意义;同时它需要综合运用信息传输技术、网络学、
杨刚是民国时期一名出色的记者,在我国新闻事业中占有重要的地位,她与彭子冈、浦熙修、戈扬并称为中国新闻界“四大名旦”,与彭子冈、浦熙修并称为民国时期新闻界“三剑客”
这些年以来,因人们的乱砍滥伐、工业废气/汽车尾气的大量排放等原因而越来越严重的温室效应、更大的臭氧层空洞,时而发生的矿难事故,家居装修及食品安全检验不合格等因素严重
伴随着我国市场经济的迅猛发展,休闲旅游成为人民日常生活的普遍选择之一。近年来,泉州市的休闲农业的发展前景迎来春天,休闲农业不单对于泉州农村地区在经济方面起到振兴的
基于模型诊断问题是NP难度的问题,在人工智能领域内有着十分重要的地位。同时,在工程医学、经济、航天等领域内,基于模型诊断问题也有着重要的应用。在早期提出基于模型诊断
空气压膜效应触觉反馈技术能够使人在普通触摸屏上感受到被显示物体的形状、纹理以及柔软性,实现自然逼真的触觉再现,一直是人机交互领域的研究热点之一,在多媒体终端实现触
云计算作为新型计算模式,其强调资源租用、应用托管等。云存储是云计算提供的一种常见服务。在云存储中,用户通过租用云端的存储资源来保存自己的数据,之后就可以随时随地通