论文部分内容阅读
联结主义(Connectionism)自二十世纪八十年代后期以来是认知心理学的主导理论之一,它被广泛应用于包括语言学在内的各个领域。联结主义分布表征的观念和对学习机制解释的合理性被语言习得研究者广泛看好,目前,联结主义已经成为解释语言习得的主导流派之一。本文在国外联结主义理论和神经网络模型研究比较成熟、联结主义引入语言习得研究的理论比较成熟的情况下,将联结主义的分布表征理论、语义提取和自组织聚类的方法引入汉语作为第二语言的留学生复合词习得研究中。着力于从理论和方法上两个方面更新的研究视点。文中介绍了联结主义理论看待习得问题的优势,利用联结主义自动提取语义表征模型WCD,做了一系列从现代汉语和中介语语料自动抽取语义的实验,对抽取出来的语义进行自组织聚类分析,并参照联结主义的理论,以此为留学生和汉语母语使用者的心理词典的假设,考察了它们的异同和发展过程。实验研究发现,初级水平的留学生还不能很好识别同家族复合词的近义、同形关系。随着水平的提高,留学生掌握同家族复合词的数量慢慢增加,他们的语义系统逐渐发展,到了高级水平,留学生能够比较好的识别同家族复合词的近义、同形等关系,但是仍然不如汉语母语使用者的语义系统完善。推测其原因在于留学生掌握同家族复合词的数量少、部分词汇使用频率低,同时用法不免有一些单一。提出要真正学好复合词必须全面的掌握它们的各种语法、语义、语用特点。实验的结果也表明,这种用联结主义的模型处理语料库的方式,可以处理一些传统语料库研究中仅靠频率分析、实例检索分析不好处理的问题,发现一些传统语料库研究很难发现的问题。例如模型可以对语料库中复合词的语义语用进行全面综合计算,收集到人很难归纳出来的上下文信息。另外,文中对复合词的语义透明度作了自动定量评定的探讨,提出语义透明度的自动评价公式的假设。实验结果表明,在模型提取出来的语义表征的基础上,进行的语义距离计算的假设,以及语义透明度自动评价的假设是有一定合理性和可行性的。本文利用联结主义的模型对中介语语料进行处理,试探了一种与传统语料库分析方法绝然不同的研究方法;对语料中抽取的语义进行自组织聚类,以此为语义心理词典的假设,去探讨留学生复合词习得的情况,同样采用了有别于传统复合词习得认知研究的方式进行研究。我们希望这种探讨是有益的。同时也希望实验中提出的改进模型训练的方法、语义距离计算的假设、语义透明度计算的假设有一定的价值。