FAQ查询算法的分析和设计

来源 :硅谷 | 被引量 : 0次 | 上传用户:hebeihuazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]在答疑系统中,对于学生常见的问题收录于数据库,学生可以通过检索的方法找到自己需要的答案,充分利用已有的资源。对此查询算法进行分析和设计。
  [关键词]FAQ 查询 信息
  中图分类号:TP3文献标识码:A 文章编号:1671-7597(2008)0320029-02
  
  在答疑系统中,关键问题就是如何理解学生输入的自然语言,并能够让系统自动返回让学生最满意的答案。下面分析如何解决这一问题。
  
  一、提问与解答内容的量化分析
  
  学生提问的形式是多种多样的,有的直接针对教材的内容、有的则是针对一条特定习题的求解。即使是对于一个完全相同的问题,两个学生的叙述也不尽相同。但所有的提问行为,究其发生的原因都是在对教学知识点的理解发生困惑,或是在应用该知识点解决实际问题的过程中存在困难,而后才发生的。所以,尽管学生提出的问题千差万别,数量是无限的,但这些问题所对应的核心却是一个有限集合:Q = {k1,k2,......,kn}(ki代表本门课程的第i个知识点)。
  不难看出,Q的秩就是教材中知识点的个数。并且由上述分析可知,教师对于学生问题的解答是围绕着k1,k2,......,kn开展的。所以对于一门课程的辅导答疑系统,其核心应围绕着该门课程中所包含的有限个知识点建立,用有限个知识点的组合去涵盖学生可能提出的无穷组问题。这是智能辅导答疑系统设计的一个根本方向。在设计过程中,采用了从每个知识点提取若干个关键词,用关键词来描述问题的特征。
  
  二、FAQ、关键词及信息提取
  
  教师首先根据知识点提取关键词,并生成关键词表;然后按课程将常见问题与解答进行分类整理,并生成FAQ表;建立FAQ表与关键词表之间的对应关系。在FAQ与关键词关系表中,同一个FAQ记录可以有多个关键词,同一个关键词也可以隶属于多个FAQ记录。FAQ与关键词关系如图1所示。
  


  从上面的分析可以看出,FAQ信息提取的关键就是用数据库中的关键词表去匹配学生用自然语言提出的问题,根据匹配程度的高低,按序返回查询结果。在描述FAQ信息查询流程之前,首先对一些对象的表示进行定义。
  R:学生用自然语言提出的问题;KT:关键词表包括关键词编号、关键词名称两个字段;KL:查询过程中生成关键词列表,只包括关键词编号一个字段;FAQ:常见问题解答表,包括(FAQ编号、FAQ内容:其中包含若干字段,这里简写)、使用次数;FKT: FAQ与关键词关系表;QAL:问题与解答列表,查询过程中生成的临时表,包括FAQ编号、匹配度、访问次数:QAL1:需返回的问题与解答列表,查询过程中生成的临时表,包括FAQ编号、匹配度、访问次数;RES:查询返回的结果集;N:查询返回结果的最大个数;F:查询返回结果的页码。
  下面结合图2对FAQ信息查询流程进行描述。
  
  (1)学生首先在客户端界面上用自然语言提出问题(R),然后提交R;
  (2)服务器端在响应后启动相应的程序,用KT去匹配R得出KL。用类SQL语句描述为:KL=(Select关键词编号from KT Where 1nStr)R,关键词名称;
  (3)根据KL从FKT和FAQ中查询得出QAL,用类SQL语句描述QAL=Select a .FAQ编号,COUNT(*) AS匹配度,b使用次数from FKT.a,FAQ.b,KL c,Where a. FAQ编号b.FAQ编号and a关键词编号=c关键词编号);
  (4)根据QAL按匹配度、使用次数降序排列返回FAQ结果返回从第P*N到(P+l )*N条匹配的记录),并将FAQ库中的相应记录的访问次数加I。用类SQL语句描述为:
  QALl=(Select * from QAL Order by QAL.匹配度DESC,QAL使用次数DESCLIMIT P*N,N);
  Update FAQ Se使用次数+l where FAQ编号IN (QALLFAQ编号);
  RES=Select*from FAQ Where FAQ编号IN(QALLFAQ编号)。
  返回查询结果后,学生再根据需要有选择地查看某一些问题的答案。
  
  三、实例分析
  
  根据上述分析,本文组织部分模拟数据,通过实例分析,演示查询过程中的一些重要细节。关键词表(KT)的内容见表1。常见问题解答表(FAQ)的内容见表2。
  


  设R=“请问如何使用excel中的if函数”,则KL={001,002};QAL={{A001,1,4 }, {A003,2,1}};QAL1={{A003,2,1 }, {A001,1,4 }};RES=FAQ编号等于A003和A001的两条记录,且A003排在A001的前面)因为A003的匹配度(2)>A001的匹配度(1)。查询后的FAQ表见表4。
  
  根据查询后生成的FAQ表,返回前N条记录,并生成查询结果界面,供学生查看。
  
  参考文献:
  [1]詹素青,基于WEB方式的自动答疑系统的设计,佛山科学技术学院学报(自然科学版),2004,54(03):46-51.
  [2]熊馨、张安琳、李潢琦,基于Web的在线答疑系统设计与实现.电脑开发与应用.2003,71(08): 25-26.
  [3]孙发勤、冯锐,网上实时答疑系统的设计与开发策略.现代教育技术.2004,43(05):71-74.
其他文献
[摘要]证明格蕴涵代数和有界可交换的“BCK-代数”是两个等价的代数系统,以及MV-代数和有界可交换BCK-代数是两个等价的代数系统。  [关键词]BCK-代数 MV-代数 格蕴涵代数  中图分类号:O15文献标识码:B文章编号:1671-7597 (2008) 0120066-02    一、预备知识      二、MV-代数与存界可交换的BCK-代数    从而由上述证明可知有界可产换BCK-
期刊
[摘要]项目管理作为一门学科正式诞生于20世纪60年代,作为管理科学的一个重要分支,项目管理在高科技开发项目和基础设施建设等大型工程项目中得到了广泛的应用。  [关键词]项目管理 关键路线法(CPM) 计划评审法(PERT) 关键链法(CCM)  中图分类号:C93文献标识码:A 文章编号:1671-7597 (2008) 0120083-01    工程项目是一项比较复杂的系统工程,其建设规模庞
期刊
[摘要]就如何有效进行泛读教学,从基于学生的“主体性”的层面进行分析,得出发挥教与学双方的主体性是优化英语专业泛读教学的重要途径的结论。  [关键词]英语专业 泛读 教学方法 主体性  中图分类号:G42文献标识码:A 文章编号:1671-7597 (2008) 0120068-01    泛读是一门进行大量阅读实践的课程,应该突出语言信息量“大”而“泛”的特点,课内不宜详细讲解,不要成为变相的精
期刊
[摘要]对于哪些人适合当领导,在管理学界一直都有研究,而其中一些研究者认为有些人所具备的某些特质可以点燃企业精神,并激发公司业绩,并称这些人为具有领袖魅力的领导(charismatic leader)。文章以阿里巴巴创始人马云为例,对具有领袖魅力的几种人格特点进行分析,初步探讨中国企业家在全球化浪潮中,如何才能卓有成效地领导企业走向成功。  [关键词]领袖魅力 企业家   中图分类号:C93文献标
期刊
[摘要]讨论3G背景下在移动通信网络建设和运营中进行有效网络优化的方法。根据3G 网络的特点,对3G 的网络优化进行了分析。  [关键词]3G 移动通信网络 网络优化  中图分类号:TN91文献标识码:B文章编号:1671-7597(2008)0320010-01    一、第三代移动通信标准的构成    第三代移动通信标准分为核心网和空中接口两大部分。  (一)核心网标准  第三代移动通信的核心
期刊
[摘要]分析高校后勤饮食成本构成、成本管理的作用和成本管理中存在的问题,针对性地提出加强高校后勤饮食成本管理的措施和办法。  [关键词]浅析 高校后勤 饮食成本 管理   中图分类号:G47文献标识码:B文章编号:1671-7597 (2008) 0120084-02    一、高校后勤饮食成本构成与成本管理的作用    (一)高校后勤饮食成本的构成  目前,我国高校后勤饮食服务实体,实行的是企业
期刊
[摘要]在钢铁生产中,轧材的捆扎一直是一个重要环节。考虑轧钢车间生产线环境差、钢材终轧温度较高等不利因素,采用PLC自动控制的全自动捆钢机,在保证原机性能和进一步完善的前提下,提高精整包装速度和包装质量,具有良好的可操作性。  [关键词]打捆机 S7-400 PLC  中图分类号:TF7文献标识码:A 文章编号:1671-7597(2008)0320015-01    一、打捆机工作原理和技术要求
期刊
[摘要]嵌入式Linux具有低成本、多种硬件平台支持、优异的性能和良好的网络支持等优点。Linux对厂商不偏不倚而且成本极低,能够很快成为用于各种设备的操作系统。  [关键词]嵌入式Linux技术 优点 版本  中图分类号:TP3文献标识码:A 文章编号:1671-7597(2008)0320035-01    一、引言    随着微处理器的产生,价格低廉、结构小巧的CPU和外设连接提供了稳定可靠
期刊
[摘要]Portal是IT领域的新技术,是企业信息化工作的发展方向之一。首先介绍Oracle Portal的定义、特点,接着阐述portal的体系结构。介绍Oracle9iAS Portal的功能特点及基于它的企业门户网站的开发。最后简要探讨了基于portal的门户网站开发的问题。  [关键词]oracle portal 门户 网站 信息入口 企业入口  中图分类号TP3文献标识码:A文章编号:1
期刊
[摘要]ODBC(Open DataBase Connectivity,开放数据库连接)提供了一组应用程序调用接口和一套运行支持环境,应用程序可以使用标准的函数进行数据库操作,而不必关心数据源来自于何种数据库管理系统(DBMS),只要有相应的驱动程序即可。介绍ODBC的原理,着重讨论Visual C++6.0 下应用MFC进行ODBC编程的方法。   [关键词]ODBC 数据库 驱动程序 数据源
期刊