基于数据挖掘的智能答疑系统的研究与设计

被引量 : 0次 | 上传用户:21stsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种教学网站的出现以及基于网络教学研究的不断深入,老师与学生的在线信息交流也日益丰富起来。在很多教学系统中,在线答疑已经成为师生交流的基本工具。然而伴随着学生提问频数的不断增加,教师对于大量问题进行一一回答的方式已经明显不能满足学生学习的需要,教师不可能时刻在线,也没有那么多的精力逐个回答学生提出的问题,在交流中学生更加希望能够给予及时有效的回答,于是一种智能化的自动答疑系统成了迫切的需要。智能答疑采用了友好的自然语言接口,使网络教学真正起到辅助教学的作用。数据挖掘在各个领域应用不断发展,近年来人们致力于寻找新的发展空间。本课题将数据挖掘算法应用于智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以实现,目标是改正当前的汉语答疑系统中存在的一些缺点,实现一个高效快速准确的智能答疑系统。该方案的设计思想:第一,充分收集教学网站中提问回答及讨论与评价等相关信息;第二,从每个问题所对应的许多答案中抽取出一个最优答案,生成一个一一对应的问题答案对库,然后进行分类存储,最后形成一个可以直接用于数据挖掘的信息全面的QA数据仓库。这一步将基于关键词的关联规则用于文档的相似度计算中,不仅可以为每个问题找出最优答案,而且可以提高问题文本聚类的查全率和查准率。将聚类后的每一类问题应用关联规则,可以得到更加准确的关联表,同时也促使相似度的精确度得以提高。因此这一循环操作可以提高答疑速率与精度;第三,系统答疑。将用户提出的问题分析,快速定位到某一类,再从数据库中查得与用户提出问题最相关的问题答案对,即相似度最大的文档,将其答案返回给用户,并将问题答案存入数据仓库,备与第二步之用。实验证明文本聚类查全率与查准率都有明显提高,该系统具有智能性,自我更新性能,不仅节约了问题答案对的存储空间而且提高了系统答疑速率与准确率等优点。
其他文献
传统的新闻听力训练往往局限于选择题,判断正误题,问答题,填空题,学生往往对新闻听力学习缺乏兴趣。本文作者结合长期新闻听力教学实践提出一种新的新闻听力模式:合作式听写
供应链零库存的方式能够真实做到供应链的一体化,但随着实践深入其风险逐渐显露。基于供应商资信风险、单证风险、物资中心仓库风险、供应链金融风险都与信用有着密切的联系,
我国汽车企业在国际竞争中实施了国际并购战略,以实现技术资源、人才资源和市场资源的有效整合和快速利用。在国际并购中,我国汽车企业面临着法律制度、企业伦理、管理文化、
针对某跨通航航道桥梁改扩建过程中受通航标准限制的实际情况,对其改扩建桥型设计方案进行了比选;对所采用改扩建方案中的主桥上部结构、引桥上部结构和下部结构进行了说明;
从中小企业行政管理的定义出发,指出中小企业行政管理有别于其他具体职能管理工作,在中小企业内部起着枢纽作用。做好行政管理工作是中小企业有效运转的重要前提,也是经营者
国际贸易出口业务中,不论交易磋商或者合同的执行,都离不开对贸易术语的选择和运用。在教学过程,引导学生精确理解贸易术语,尤其是最为常用的贸易术语FOB及CIF中出口商须承担
为了保证车辆在隧道内行驶安全,设计照明时的各项参数是按最大值考虑的。因此照度始终是处于最大值状态。目前,隧道照明大多采用人工控制的方式进行开关和检查,这种方式存在种种
通过对水泥稳定砂砾基层施工中出现裂缝、离析的成因进行分析,结合星哈(星星峡—哈密)高速公路水稳基层摊铺,分析了大厚度大宽幅水稳摊铺工艺在抑制水稳基层摊铺离析和裂缝、
本文观察尼莫地平预防创伤性蛛网膜下腔出血(SAH)所致的脑血管痉挛(CVS)。将创伤性SAH病人136例分为两组,尼莫地平组(65例)于伤后24小时内给予尼莫地平治疗,对照组(71例)采用
该文首先介绍了简·奥斯汀的写作技巧和特色,其次通过例子对王科一和孙治理的中译本对词汇和句式的不同翻译进行对比研究,最后找出影响小说翻译的主要因素,从中学习到对于幽