基于Hellinger距离的视觉信息的汉语语义习得

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:chifelonh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
认知科学的研究表明,感知信息对自然语言习得有重要的辅助作用。由于机器不能独立地把词汇和感知世界进行关联,因此出现了Grounded语义学,即语言符号和感知符号相连接的研究。ViMac(Visual Information based Meaning Acquisition of Chinese Words:基于视觉信息的汉语词义习得)系统是第一个基于简单几何图形的看图说话系统及其语言描述对来构建基于视觉特征的汉语词汇语义的系统,该系统得到的汉语词汇语义可用于一个图像的描述自动生成系统ViMacs(ViMac Application System)中,对输入的包含简单几何图形的图像产生一些自然语言的描述语句,即实现从视觉信息到自然语言的信息表达的模态转换过程。在ViMac系统中,距离度量在构建基于视觉信息的词汇语义的几个关键阶段都起到了重要作用,是影响系统性能的重要因素,但是,目前的采用的KL距离度量存在一些问题,不能很好地适合ViMac系统的需要。本文通过对ViMac系统学习过程的分析研究和对ViMac系统的距离度量存在的问题进行分析,并对多种距离度量算法进行比较,提出了采用Hellinger距离作为其距离度量的方法。本文利用Hellinger距离对ViMac系统的语义关联模块以及聚类模块进行了改进,并将一维Hellinger距离推广到多维Hellinger距离,对ViMac系统的特征选择模块进行改进。系统评测结果表明,采用Hellinger距离作为新的距离度量方法有效地提高了ViMacs系统生成语言描述的性能。除此之外,本文还对ViMac系统的语义建模模块进行了改进,把ViMac系统应用的高斯语义建模更换为在ViMacs中使用k.近邻算法进行语义建模,实验结果表明,基于k-近邻的语义建模有效提高了ViMacs系统的性能。
其他文献
近年来,嵌入式系统的使用越来越广泛,在控制领域也是如此。μC/OS-Ⅱ是一个著名的开源嵌入式操作系统,但是缺乏对网络功能的支持。LwIP是一个开源TCP/IP协议栈,其实现的重点
随着网络通信技术和多媒体技术的发展和信息需求的不断增长,多媒体信息已经成为各类信息系统的主要数据来源形式。其中,视频在网络多媒体元素中的地位与日俱增,如何快速准确
现如今,计算机等计算设备以及互联网已然成为了这个时代的关键词。这类信息化产物的不断发展缩短了人与人之间的距离,拓展了人们的视野,同时也大大地便捷了人们的沟通。在这样的
乙烯裂解过程和油品调和过程是重要的基础石油化工过程,对其生产工艺的优化研究有助于提高生产质量和降低较高的工业成本。由于实际生产中企业需要综合考虑实现成本最小的同时
面对不断推陈出新的隐写技术以及互联网上不断涌现的数以亿计的多媒体文件,隐写分析技术需要从两个方面着手应对。第一,推出具有良好泛化能力的通用隐写分析算法,以应对从未
信息可视化(InfoVis)是文本数据挖掘的一项重要研究方向,也是人们从单一的信息数据中获取有用知识的一种重要途径。而数据挖掘正是从大量数据中提取潜在的,对使用者有价值意
近年来,现代工业过程的规模日趋大型化,过程的工艺也日趋复杂化。工业过程的大型化和复杂化使得系统面临的风险越来越大,系统发生故障的概率也越来越高。由于系统的高复杂化,使得
随着计算机技术、通信技术的快速发展,且日趋紧密地互相结合,作为数据处理的新兴技术——数据融合技术,在近10年中得到惊人发展,该技术已应用于诸多军事领域及民事领域。数据
目前的互联网流量中充斥着各种数据,其中一大部分是近十年兴起并迅速发展的对等网络(Peer-to-Peer)应用。因此对于P2P业务的流量控制和管理在网络管理中显得尤为重要。P2P流
视觉传感器网络中的视觉节点感知模型为有向感知模型,节点视野受限,因此我们部署的节点不应是静止的,一般节点分为如下三类:可移动,可旋转以及既可以移动又可以旋转。对于这