范例推理与互联网文本信息处理研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：wekey

【摘要】

：

近年来，范例推理(Case-Based Reasoning，CBR)的基础研究及系统实现正受到人们的普遍关注，是当今人工智能研究的前沿课题。CBR不仅是关于人类认知的心理学理论，而且将成为智能计算

【作者】

：

耿焕同

【出处】

：

中国科学技术大学

【发表日期】

：

2006年期

【关键词】

：

范例推理数据挖掘聚类互联网文本信息处理数据抽查

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，范例推理(Case-Based Reasoning，CBR)的基础研究及系统实现正受到人们的普遍关注，是当今人工智能研究的前沿课题。CBR不仅是关于人类认知的心理学理论，而且将成为智能计算机系统技术中新的基石之一。CBR技术在知识不良定义和专家知识不全的领域中应用效果很好，但CBR系统中仍存在着知识获取和维护瓶颈问题。另一方面，数据挖掘(Data Mining，DM)技术是从大量数据中发现知识，因此是解决知识获取和维护瓶颈问题的有效途径之一。将范例推理研究与数据挖掘技术相结合，是具有重要意义的研究方向。随着互联网的普及，Web文本资源已呈现几何级数的增长，有效地获取蕴藏在Web文本资源中的大量未知的、有用的信息，正成为国内外学者关注的研究热点。其中Web文本的预处理和文本理解又是互联网文本信息处理基础性工作，该工作必将有力地推动计算机对大规模Web文本资源的自动处理。随着人工智能技术的不断成熟，专家系统技术正被研究者引入到互联网文本信息处理领域中，为理解互联网文本信息开辟了新的研究方向。本论文围绕以上几个方面，进行了深入的研究。论文的主要内容为：首先，将数据挖掘技术引入到范例推理系统中，解决系统中的知识获取和维护瓶颈问题。主要的工作有：一是结合数据挖掘中的聚类算法与脚标数据的特点，给出了一种有效的基于能力的范例库自动建立新方法；二是结合基于选择的CLARA聚类方法和NCL聚类算法的优点，给出了一种无监督下对范例进行准确归类聚类学习算法，该方法能大大地提高范例提取的速度和质量；三是给出了基于聚类方法的范例删除和范例增加维护策略。以上这些都将有利于增强CBR系统解决问题的有效性和实用性。此外还针对传统数据抽查方法很难保证数据抽查有效性的缺点，结合离群数据挖掘的方法，给出了一种基于离群数据挖掘的数据抽查新方法。该方法能克服传统数据抽查方法的缺陷，从而保证了数据抽查的有效性和全面性。其次，开展了对互联网文本信息自动处理中的主题词自动抽取和文档自动摘要等基础性工作的研究。具体包括：一是在对现有主题词抽取方法深入研究的基础上，提出了一种基于词共现图的文档主题词自动抽取新方法，该方法以词频统

其他文献

新规定下高校体质测试的困境与对策

采用文献资料法、访谈法和逻辑分析法,对我国当前高校体质测试所面临的困境进行研究。研究中发现:对于体质测试上下级之间沟通不够;数据失真的问题依然存在;学生对待测试的态

会议

新规定高校体质测试困境对策

最危险的南极探险

当4名失事英国探险家半死不活地穿过雪堆,满脸胡子,褴楼衣服与脸带着污垢最后来到了边远的南乔治岛挪威人的捕鲸站时,年轻的孩子们吓的逃开了。那是在1916年5月20日。那些人能活着到达那里真是个奇迹。在南极圈附近冰海上忍受饥饿、疾病与那让人畏惧的寒冷整整18个月后,埃勒耐斯特·萨克莱顿爵士和他的船员从南极回来的消息让布宜诺斯爱利

期刊

南极探险英国探险家

中医温阳利水法治疗慢性心力衰竭的意义分析与评定

目的:观察和探讨心力衰竭患者给予中医温阳利水法治疗的效果。方法:76例心力衰竭患者,按照随机数字表法分为治疗组和对照组,各38例。两组患者均采用常规治疗措施,在此基础上

期刊

温阳利水法慢性心力衰竭意义评定

关于对国家审计署就中国远洋运输(集团)总公司2013年度财务收支审计结果的整改情况

2014年，国家审计署对中国远洋运输（集团）总公司2013年度财务收支情况进行了审计。此次审计既是国家审计署代表国家对我公司财务收支进行的审计监督，又是对我公司经营管理的全面诊

报纸

脑梗死患者近期预后与白细胞数、血糖值的关系

目的：观察脑梗死患者近期预后与白细胞数、血糖值的关系。方法：将376例经CT证实的急性脑梗死患者。据入院时按白细胞计数的不同、空腹血糖值,以及糖尿病病史等分组,并对其入院

期刊