基于全文检索的自动答疑系统的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:duminzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文首先分析了国内外全文检索技术的最新发展和应用于远程教育的答疑系统的现状,有针对性地对全文检索引擎进行研究和改造.考虑到多种应用环境下中英文文本为主,多种国家文字或者文本符号并存的情况,该文讨论了利用Unicode编码建立支持多语种的索引库.在词法分析阶段,提出了中英文混合分词的方案,供全文检索引擎支持不同应用.该论文继续讨论了以全文检索为基础的自动答疑模型.论文提出了利用分词程序构造问题分析器,对自动答疑中输入的问题进行分析处理,不过多考虑问题句子结构,着重提取问题包含的问题类型和提问焦点信息.然后,为了提高匹配效率和答案的准确性,提出了两阶段匹配策略:问题与问题的匹配和问题与答案的匹配,获取答案文本;设计了答案提取算法,根据问题信息在得到的文本材料中提取更为精确的答案;再由自动答疑的自反馈流程,把答疑过程形成的新问答材料保存到答疑库.
其他文献
随着物联网的兴起,嵌入式处理器也迎来了新一轮蓬勃发展。受限于应用需求,嵌入式处理器只能在严格控制成本、面积和功耗的前提下进行设计。MIPS架构的嵌入式处理器是主流商用产
Internet的蓬勃发展促使全世界的数据通信业务爆炸性的增长,随着网络中数据业务量成为主导后,以IP交换为基础的通信网框架成为信息通信的主导技术。 当前,电信运营商、Intern
本文介绍了在PTCAD2000平台下短路电流可视化计算软件的开发。介绍了软件的系统结构、数据结构定义、与PTCAD2000平台的接口、电力系统原始接线图转成等值可计算网络、序网的生成、考虑零序互感线路阻抗时电网导纳矩阵和阻抗矩阵的生成,以及故障点短路电流计算的计算机实现。通过建立可视化的电网数学模型,程序实现了电力系统下短路故障的计算和分析,为在PTCAD2000平台下高压输配电网的设备选型提供了
从数据库内自动获取知识是知识获取技术的一个重要的研究课题,利用知识的自动获取技术,可以解决知识获取上的"瓶颈"问题.目前,在研究知识的自动获取技术上已经有了很多成果.
学位
在工业、能源、交通、航空航天、水利、经济管理及社会等系统中,非线性和时滞是普遍存在的。对时滞系统和非线性控制系统的分析,无论从理论上还是在实践中都是很有意义的。对于
时空数据库作为数据库研究领域中的一个重要分支,经过近十年的发展,在时空数据模型、时空查询优化与索引和时空本体论等方面取得了许多成果.现实世界中的许多实体都具有空间
随着Internet技术的发展,网络的安全性问题越显重要,各种网络安全技术也成为研究的热点。入侵检测作为安全防卫系统的最后一道防线,还能起到保护其他安全子系统的作用,因此对入侵
Internet的迅速发展带动了电子商务的兴起,而虚拟现实技术的引入则进一步提高了电子商务的可行性.该文指出了为满足电子商务发展的需要,开展针对网上虚拟商品展示的有关技术
第二层隧道协议(Layer 2 Tunneling Protocol)作为借用公用数据网建立公用隧道在远程用户之间提供对第二层协议(特别是使用极广的点到点协议(PPP))进行中继,提供实现远程专用