论文部分内容阅读
认知科学的研究表明,感知信息对自然语言习得有重要的辅助作用。由于机器不能独立地把词汇和感知世界进行关联,因此出现了Grounded语义学,即语言符号和感知符号相连接的研究。ViMac(Visual Information based Meaning Acquisition of Chinese Words:基于视觉信息的汉语词义习得)系统是第一个基于简单几何图形的看图说话系统及其语言描述对来构建基于视觉特征的汉语词汇语义的系统,该系统得到的汉语词汇语义可用于一个图像的描述自动生成系统ViMacs(ViMac Application System)中,对输入的包含简单几何图形的图像产生一些自然语言的描述语句,即实现从视觉信息到自然语言的信息表达的模态转换过程。在ViMac系统中,距离度量在构建基于视觉信息的词汇语义的几个关键阶段都起到了重要作用,是影响系统性能的重要因素,但是,目前的采用的KL距离度量存在一些问题,不能很好地适合ViMac系统的需要。本文通过对ViMac系统学习过程的分析研究和对ViMac系统的距离度量存在的问题进行分析,并对多种距离度量算法进行比较,提出了采用Hellinger距离作为其距离度量的方法。本文利用Hellinger距离对ViMac系统的语义关联模块以及聚类模块进行了改进,并将一维Hellinger距离推广到多维Hellinger距离,对ViMac系统的特征选择模块进行改进。系统评测结果表明,采用Hellinger距离作为新的距离度量方法有效地提高了ViMacs系统生成语言描述的性能。除此之外,本文还对ViMac系统的语义建模模块进行了改进,把ViMac系统应用的高斯语义建模更换为在ViMacs中使用k.近邻算法进行语义建模,实验结果表明,基于k-近邻的语义建模有效提高了ViMacs系统的性能。