基于人类认知过程的文本语义理解模型（HTSC）及构建方法研究

来源 :上海大学 | 被引量 : 3次 | 上传用户：loveyue0414

【摘要】

：

随着网络的迅速发展,网络中的文本信息呈现海量、快速、多样、稀疏的特征,从而使得网络用户经常出现迷航现象。在此情况下,我们需要一种面向机器的文本语义理解方法来辅助人

【作者】

：

张俊

【出处】

：

上海大学

【发表日期】

：

2016年01期

【关键词】

：

文本语义理解语义表征认知过程动态理解过程语义关系发现复杂度度量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络的迅速发展,网络中的文本信息呈现海量、快速、多样、稀疏的特征,从而使得网络用户经常出现迷航现象。在此情况下,我们需要一种面向机器的文本语义理解方法来辅助人们高效地组织、管理这些大规模网络文本信息,进而为人们提供优质的网络服务。但是,目前的机器文本语义理解方法存在以下问题,包括:(1)人类文本语义表达能力与机器文本语义理解能力之间存在较大鸿沟;(2)机器文本语义理解复杂性与网络文本数据海量性之间的矛盾;(3)机器的文本语义理解过程缺乏背景知识指导。针对上述三个问题,本文提出了基于人类认知过程的文本语义理解HTSC模型,本模型的基本思想为“认知框架+轻量级算法实现”,通过模拟人类的认知过程,以使机器文本语义理解结果更符合人类的认知结果,从而解决问题(1);通过轻量级的算法实现,以使本模型能够适应、处理大规模的网络文本环境,从而解决问题(2);在认知框架下,通过当前文本语义与背景知识间循环往复的动态理解过程,以从全局的角度来理解文本语义,从而解决问题(3)。本文具体研究以下内容:1.基于人类的记忆认知过程和文本信息加工过程理论,提出由感觉记忆、知觉关联记忆、工作记忆、短期情景记忆和长时记忆等几部分构成的文本语义理解HTSC模型,为面向机器的文本语义理解提供框架指导。2.在HTSC模型总体框架基础上,提出了HTSC模型中各个记忆系统下的文本语义表征方法,从而为机器的文本语义理解提供理论载体,包括:基于课文多水平表征理论,提出基于工作记忆的文本语义表征方法;基于关键词、篇章、话题三层文本语义网络,提出HTSC模型中基于短期情景记忆和长时记忆的文本语义表征方法;基于人类概念学习过程,提出文本语义幂级数表征方法。3.在语言学配价理论的基础上,提出了词之间语义关系的挖掘方法,避免了传统关联规则挖掘方法语义信息低下、挖掘效果参数依赖性高的缺陷,为机器文本语义理解中语义关系的发现提供了可能,包括:基于配价理论以及句子压膜理论,提出文本中动词依赖集挖掘方法;在动词依赖集基础上,结合关联规则挖掘方法,提出词之间原子语义关系挖掘方法;基于词之间原子语义关系,并结合文本中动词依赖集,提出词之间具体语义关系挖掘方法。4.在人类认知过程的基础上,提出了面向机器的文本语义动态理解过程,以使得机器的文本语义理解更符合人类的认知结果,包括:基于连通图理论,对文本语义连贯范式进行形式化定义;基于文本语义连贯范式,提出当前文本语义中激活线索的产生方法;基于语义链网络,提出背景知识激活方法以及融合方法。5.基于人类概念学习过程中的复杂度度量理论,提出了文本理解的复杂度度量方法,从而为不同层次用户提供个性化服务提供了可能,包括:基于概念代数复杂度度量,提出文本代数复杂度ACT;通过分析文本语义理解复杂度的影响因子,提出关键词及其之上关联关系的复杂度度量方法;基于关键词及其之上关联关系复杂度,提出文本代数复杂度改进方法,包括扩展型文本代数复杂度EACT和泛化型文本代数复杂度GEACT。6.基于HTSC模型及其之上的复杂度度量方法,研究与开发了两个应用演示系统:基于认知过程的智能交互系统和基于复杂度度量的搜索演示系统,从而为本文提出的HTSC模型提供了真实、合理的应用场景。本文以基于人类认知过的文本语义理解模型研究为突破,探索建立面向机器文本语义理解的理论与方法体系,进一步从理论上研究了文本语义的表征方法、词之间语义关系发现方法、当前文本语义与背景知识的动态交互方法,以及复杂度度量方法等。本研究成果能够直接应用于语义搜索、个性化推荐、用户关系发现、网络舆情监测等方面。

其他文献

重型车侧翻特性理论分析及防侧翻支架设计

为研究重型车侧翻特性，建立准静态侧翻的系统理论计算模型，导出其侧倾力臂 h和整车等效轮距B的理论计算公式，分析了各主要参数的影响，并以某重载搅拌车为例，计算了其准静态侧翻阀

期刊

侧翻特性理论分析防侧翻支架试验

焦勉斋针刺手法精要

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

针刺手法焦勉斋名医经验

中药贝母分类咨询系统(CSCF)

<正> 在人工智能的研究中,从工程学的角度出发把所要开发的技术组成一个体系,这就是知识工程学,而知识工程学的核心则是专家系统。专家系统是一个具有大量专门知识与经验的程

期刊

专家系统贝母属植物分类显微鉴定

人脸面部属性估计与老化合成研究

人脸分析一般包括对人脸中身份特征、年龄特征、表情属性、面部特征属性、性别属性、种族属性等进行分析。目前的身份特征识别方法还缺乏更为细致的身份信息描述,如面部五官

学位

人脸分析人脸合成人脸属性人脸老化人脸验证人脸变形字典学习深度学习卷积神经网络

鞍钢新高炉热风炉拱顶焊后时效处理技术

通过对高炉热风炉拱顶振动消除应力的技术研究,证明了振动时效技术用于消除冶金设备的大型构件应力是可行的,给出了具体的处理工艺参数及效果检测结果.

期刊

振动时效热风炉残余应力

加强集团性企业财务管理与提高管理的质量初探

企业集团是适应市场经济和社会化大生产的客观需要而出现的一种经济联合体。作为以企业集团为基础的财务管理，其管理模式的选择与构建，直接影响企业财务管理的质量与效果，管好用

期刊

集团财务管理提高

胆道镜2μm激光治疗肝内胆管结石并发肝功能不全七例报告

目的分析胆道镜2μm激光治疗肝内胆管结石并发肝功能不全的原因及预防。方法总结2010年至2014年采用腹腔镜下胆道镜联合2μm激光碎石治疗肝内胆管结石42例,分析严重手术并发

期刊

内窥镜检查碎石术激光肝功能不全Endoscopy Lithotripsy easer Hepatic insufficiency

基于模糊聚类及活动轮廓模型的图像分割技术研究

随着电子计算机技术的发展,数字图像处理作为一门新兴的学科已经成为信息社会中必不可少的工具。图像分割作为图像处理和计算机视觉、目标跟踪、以及医疗成像的基本课题,其主

学位

图像分割水平集活动轮廓模型模糊聚类灰度不均匀噪声

道教是什么

期刊

天师道五斗米道全真道是什么

浅析中国古典园林之造园手法——以苏州沧浪亭为例

为探索中国古典园林的优秀技法与人文精神,本文以苏州沧浪亭为例,通过对其园址变迁、空间布局、园中建筑、造景与意境的结合等方面进行分析,总结中国古典园林的造园手法及特

期刊

中国古典园林沧浪亭现代园林

基于人类认知过程的文本语义理解模型（HTSC）及构建方法研究

其他学术论文