基于语义相似度计算的智能答疑系统

来源 :重庆师范大学 | 被引量 : 0次 | 上传用户:czg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的不断发展,越来越多的文本信息充斥在我们的生活中。如何在海量信息中快速挖掘出我们所需要的目标信息,成为了我们提高工作效率的重中之重。语义相似度计算(Semantic Similarity Calculation)凭借其对文本间相似程度的准确计算和计算结果的具体量化显示,成为了自然语言处理领域的重要组成部分。该方法在文本分类、信息检索、同义词测试、问答系统等方面起着举足轻重的作用。目前,在全国大力推行“互联网+”的背景下,“互联网+教育”应运而生。由于网络教育存在地理位置的分割性、师生时间的不一致性,使得教学过程中极为重要的答疑环节成为阻碍网络教育发展的瓶颈。但现有的答疑系统往往仅通过数据库检索或者人工答疑的方法进行答疑,答疑准确率和实效性存在一定的问题。因此,本文对语义相似度相关算法进行了研究,并实现了一个基于语义相似度计算的智能答疑系统。本文具体研究工作如下:(1)智能答疑算法研究与应用。首先是对本实验中的各个算法进行的详细的对比和介绍,包括中文分词词典的构建、三种常用的基于字符串匹配的中文分词算法、向量空间模型算法。其中核心部分为提出一种改进TF-IDF权重计算方法对分词后的各个特征项的权重进行计算,在计算出权重后利用向量空间模型中的余弦相似度的计算方法对问题间的相似度进行计算;(2)基于语义相似度计算的智能答疑系统的实现。本文在完成算法研究后,实现了一个智能答疑系统。首先对系统进行了分析与设计,包括系统的需求分析、概要设计、功能模块设计、数据库设计等环节;随后完成了系统的实现与测试,系统已基本实现预期的全部功能,包括:自动答疑、教师辅助答疑、学生教师身份互换、相似问题推荐等功能。经过测试,该系统基本可以满足课程答疑的日常需求。
其他文献
衡量一个国家特殊教育发展水平的重要标尺是教育公平和教育普及程度,也是一个国家社会文明程度的重要标志。而特殊需要儿童的发展和特殊教育质量的提高,关键在于特殊教师专业素质和特殊教育教师队伍的建设的提升。我国相关的政策法规对特殊教育教师的专业素质提出了明确的要求,同时我国残疾儿童少年义务教育在中西部农村地区特别是边远贫困地区普及水平仍然偏低,非义务教育阶段教育发展整体相对滞后,特殊教育条件保障机制不够完
随着国际贸易的深入发展,文化因素对贸易的影响作用逐渐受到学界的重视。中国与东盟关系正常化以来,双方在经贸领域取得了飞速的发展,中国已连续十年保持为东盟第一大贸易伙伴,东盟已成为中国第二大贸易伙伴。在“一带一路”倡议出台以后,新时期中国与东盟的经贸关系备受关注。中国与东南亚地区有着源远流长的人文交流历史,文化在中国-东盟经贸发展中是否扮演重要角色,文化事件又该如何量化分析,本文将进一步考究。本文以文
本文研究的是啶氧菌酯·丙环唑复配剂对水稻主发病害水稻纹枯病、稻曲病及花生叶斑病应用技术,研究过程中主要是通过查阅文献对相关化学药剂防治进展进行研究,对相关防治病害
“三农”问题一直是萦绕中国的社会现实问题。我国也一直致力于创新农民、农业、农村的持续发展模式。今年作为全面建成小康社会的实现之年,对于我国来说具有深远的意义。农民作为一个庞大的群体,怎样在市场经济中站稳脚跟、持续发展是值得深入研究的问题。农民合作社作为一种非盈利的组织形式,在当下越来越广泛存在。从历史的车轮中可以看出,其存在是适应市场经济环境的结果,因此,该种形式离不开人们的关心和维护,为了促进其
随着用户和市场对移动通信要求不断提高,促使着通信技术快速发展。4G移动通信系统传输速率以及接入能力已经无法满足各行各业不断增加的需求。对此,提高通信速率和通信质量是对5G移动通信系统的要求。而且,目前高速场景下通信已经越来越重要,高速场景下,过高的多普勒频移和导频开销导致获取信道状态信息难度提高,传统OFDM系统性能达不到要求,对此,OTFS系统通过将时变信道转换为时不变的时延-多普勒信道,在高速
糖基化修饰是一种普遍存在的翻译后修饰,广泛参与了细胞的多种生命过程,包括信号转导、细胞凋亡、转录调控、免疫反应、炎症反应等生理过程,以及肿瘤、神经退行性等疾病发展过程中,对糖基化修饰的研究有重要意义。但是,糖研究工具的缺陷阻碍了整个领域的研究进程。在目前的研究中,凝集素和糖抗体为主要的糖生物学识别工具,然而这两者在特异性和亲和力上都有待提高,不能够很好地满足研究的需求。因此,寻找更优的糖基化修饰识
在西方个体化进程和中国市场经济的推动之下,生育后选择外出工作,兼顾工作和家庭成为中国女性的生活常态。“焦虑”、“进退两难”已然成为“职场妈妈”的代名词。90后“职场
近年来,随着数据的采集和存储技术的飞速发展,尤其是互联网的广泛应用,各行各业积累了大量的数据。为了从数据中挖掘出更多的有用信息和知识,人们结合机器学习和数据挖掘进行数据分析。聚类算法作为机器学习和数据挖掘的重要组成部分,被人们广泛地使用和研究。不断地完善和提高聚类算法的性能和准确性,成为研究者孜孜不倦的追求。本文对广泛使用的谱聚类算法进行了深入地研究与分析,对算法进行了改进,使其更能适用于大规模数
由于分布式发电的间歇性和随机性,以及其接入微电网过程中大量电力电子装置的存在,微电网容易产生功率震荡,与此同时系统的转动惯量和阻尼减小,使微电网系统的强度变弱。而传统控制策略难以满足孤岛微电网对自治运行的要求,失稳的可能性大大增加。为实现孤岛微电网对频率和电压支撑需求,本文对微电网逆变器采用虚拟同步发电机(virtual synchronous generator,VSG)控制策略,建立VSG逆变
抗菌肽是一类耐受高温、分子量小、抗菌范围广的多肽类物质,这种肽类物质多是由生物体在防御外来病原体侵害时由免疫系统产生的天然多肽。与传统抗生素相比,抗菌肽表现出更稳定和更广泛的抗菌活性。除了对细菌、真菌的抑制作用还能够抑杀一些病毒和原虫。由于其广谱的抑菌特性和不易使各种细菌产生抗药性等重要优点,得到越来越多学者和专家的关注。杂合抗菌肽,是通过基因合成技术将两种或多种不同类型的天然抗菌肽采用一定的设计