范例推理与互联网文本信息处理研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wekey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,范例推理(Case-Based Reasoning,CBR)的基础研究及系统实现正受到人们的普遍关注,是当今人工智能研究的前沿课题。CBR不仅是关于人类认知的心理学理论,而且将成为智能计算机系统技术中新的基石之一。CBR技术在知识不良定义和专家知识不全的领域中应用效果很好,但CBR系统中仍存在着知识获取和维护瓶颈问题。另一方面,数据挖掘(Data Mining,DM)技术是从大量数据中发现知识,因此是解决知识获取和维护瓶颈问题的有效途径之一。将范例推理研究与数据挖掘技术相结合,是具有重要意义的研究方向。 随着互联网的普及,Web文本资源已呈现几何级数的增长,有效地获取蕴藏在Web文本资源中的大量未知的、有用的信息,正成为国内外学者关注的研究热点。其中Web文本的预处理和文本理解又是互联网文本信息处理基础性工作,该工作必将有力地推动计算机对大规模Web文本资源的自动处理。 随着人工智能技术的不断成熟,专家系统技术正被研究者引入到互联网文本信息处理领域中,为理解互联网文本信息开辟了新的研究方向。 本论文围绕以上几个方面,进行了深入的研究。论文的主要内容为: 首先,将数据挖掘技术引入到范例推理系统中,解决系统中的知识获取和维护瓶颈问题。主要的工作有:一是结合数据挖掘中的聚类算法与脚标数据的特点,给出了一种有效的基于能力的范例库自动建立新方法;二是结合基于选择的CLARA聚类方法和NCL聚类算法的优点,给出了一种无监督下对范例进行准确归类聚类学习算法,该方法能大大地提高范例提取的速度和质量;三是给出了基于聚类方法的范例删除和范例增加维护策略。以上这些都将有利于增强CBR系统解决问题的有效性和实用性。此外还针对传统数据抽查方法很难保证数据抽查有效性的缺点,结合离群数据挖掘的方法,给出了一种基于离群数据挖掘的数据抽查新方法。该方法能克服传统数据抽查方法的缺陷,从而保证了数据抽查的有效性和全面性。 其次,开展了对互联网文本信息自动处理中的主题词自动抽取和文档自动摘要等基础性工作的研究。具体包括:一是在对现有主题词抽取方法深入研究的基础上,提出了一种基于词共现图的文档主题词自动抽取新方法,该方法以词频统
其他文献
采用文献资料法、访谈法和逻辑分析法,对我国当前高校体质测试所面临的困境进行研究。研究中发现:对于体质测试上下级之间沟通不够;数据失真的问题依然存在;学生对待测试的态
当4名失事英国探险家半死不活地穿过雪堆,满脸胡子,褴楼衣服与脸带着污垢最后来到了边远的南乔治岛挪威人的捕鲸站时,年轻的孩子们吓的逃开了。那是在1916年5月20日。那些人能活着到达那里真是个奇迹。在南极圈附近冰海上忍受饥饿、疾病与那让人畏惧的寒冷整整18个月后,埃勒耐斯特·萨克莱顿爵士和他的船员从南极回来的消息让布宜诺斯爱利
目的:观察和探讨心力衰竭患者给予中医温阳利水法治疗的效果。方法:76例心力衰竭患者,按照随机数字表法分为治疗组和对照组,各38例。两组患者均采用常规治疗措施,在此基础上
2014年,国家审计署对中国远洋运输(集团)总公司2013年度财务收支情况进行了审计。此次审计既是国家审计署代表国家对我公司财务收支进行的审计监督,又是对我公司经营管理的全面诊
报纸
目的:观察脑梗死患者近期预后与白细胞数、血糖值的关系。方法:将376例经CT证实的急性脑梗死患者。据入院时按白细胞计数的不同、空腹血糖值,以及糖尿病病史等分组,并对其入院
<正> 天才人物是怎样萌发那些奇思异想的?达芬奇在制作旷世名画蒙娜丽莎时的思维模式与提出相对论的爱因斯坦之间有什么联系?我们从伽利略、爱迪生和莫扎特这些历史巨
拥有250多万平方公里国土的苏丹,是非洲面积最大的国家。这个遥远的非洲国家拥有很多妙趣横生的习俗,最令人开眼界的是苏丹人的婚俗趣事!
可重构计算是一种新型的时空域计算模式,它利用了可重构逻辑器件的可重构特性,同时具有类似处理器的以在线编程方式实现各种应用的灵活性和类似专用集成电路的以硬件方式执行计
<正> 铀、钚等重原子核在中子轰击下分裂,发生&#39;链式反应&#39;的现象是20世纪最重大的科学发现之一,而核电站又是&#39;链式反应&#39;最重要的应用之一,现在全世界已有437
CAD/CAM是先进制造技术的重要组成部分,数控加工是CAD/CAM技术中最能明显发挥经济效益的环节之一。论文以工程应用为背景,以提高制造质量和效率为目标,深入研究了CAD/CAM系统中