论文部分内容阅读
互联网,作为现代社会人们获取信息、学习知识、相互交流的载体,越来越成为人们日常生活中的必要组成部分。随着互联网应用的日益增加,如:个性定制、搜索引擎、社交网络、喜好推荐,智能交互等等,人们越来越迫切的希望互联网更加的智能,期待着从互联网中获取更多的信息、期待着可以与互联网进行交互,这些都给智能信息处理、机器翻译、Web服务等领域的研究者们提出新的挑战。 为了实现让互联网更加智能,更贴近于人们的直观感受,在交互的过程中,更好的理解人们的意图,就要求互联网可以更好的理解人们的需求。在现如今的大多数互联网应用中,主要依靠的是人来输入需求,进而通过互联网的相关技术来实现用户意图。但是,现阶段的对与用户意图的识别还仅仅局限在对用户需求的重现频率上,是一种较为机械的方式。而在未来的互联网中,需要的是可以真正理解的用户需求或用户意图的方法,因此,研究者们将重点放在了语义相似度上。 让互联网更加智能,其本质就在于寻找与用户意图的语义无限接近的结果,即就是,概念的语义相似度计算。传统的语义相似度计算,更多的是利用了语义资源所定义好的语义关系,通过一定的数学公式,实现了两个概念间的语义相似度计算,这样的计算方式太过于机械,而且也太过于依赖语义资源的已经定义良好的语义关系。本文在深入分析了众多概念语义相似度计算方法,以及主流的语义资源,在结合日常使用互联网的行为,给出了一个基于贝叶斯网络推理的概念语义相似度计算模型,借用推理的机制,结合经验知识,使得语义可以在一个概念网络中充分的传递,使得语义相似度的计算更加动态化,这样符合人们对互联网的日常需求。 为了实现贝叶斯网络的概念相似度计算,本文的工作主要包括: 1.提出将贝叶斯网络的不确定性知识表示与推理引入到了概念相似度计算中,利用其三种推理模式,实现了语义在概念网络的信息传递; 2.提出了新的概念语义距离计算,不同于传统的语义距离计算,我们将信息量的知识用于获取概念网络的中节点的语义信息量,并借此获取概念节点间的信息权值,该权值反映了两个节点间的语义信息的强度。 3.为了解决计算复杂与语义信息充分传递的矛盾,在已有的d-separation的基础上,我们提出了一个d-new separation标准,从而有效解决了以上的矛盾。 概念的语义相似度计算是机器翻译,Web服务匹配,信息检索,推荐系统等众多智能信息处理领域的基础性研究,对于互联网未来的发展起到了基础性的作用,而概念语义相似度计算的不断改善,能够让互联网更好的服务于人们的生活,学习。