基于内容的题目语义检索系统

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:wenjie033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着网络技术的不断发展,互联网已经渗透到人类社会的各个方面,包括在线教育领域。对于在线教育而言,题目资源是最重要的资源,对题目信息进行检索是一个强烈的需求。题目资源存在重复率高、获取困难和非规范化等问题,传统的资源搜索很难从海量的信息中筛选符合需求的题目信息。因此,设计并实现一个针对题目信息的语义检索系统,无论是对科学研究还是工程应用都极具挑战性。本文基于词向量和深度学习在自然语言处理领域的研究,设计并实现了一个基于内容的题目语义检索系统。本文主要研究内容如下:(1)研究并实现基于神经网络语言模型的词向量表示方法,利用大规模的文本语料和word2vec工具进行词向量训练,并对词语相似度计算进行实验。(2)研究并实现基于字向量和双向长短时记忆(Bidirectional Long-Short Term Memory, BLSTM ) 模型的 中文分词方法 。首先从大规模语料中学习中文字的语义向量,再将字向量应用于BLSTM模型实现分词,在标准数据集上进行的实验验证了本方法的有效性。(3)设计并实现基于词向量和支持向量机(Support Vector Machine,SVM)模型的中文同义词扩展方法。基于词向量对词语的语义表示,将词向量作为特征输入SVM分类模型中进行同义词的判别,实现在相同语境下的中文同义词的扩展。(4)实现了一个基于内容的题目语义检索系统,利用分词算法和同义词扩展算法实现查询扩展,具有很高的研究价值和社会应用价值。
其他文献
现在人们非常依赖智能手机,几乎天天都在使用,这使得智能手机中有很多隐私信息。苹果公司的iOS系统是当前最流行的手机操作系统之一,由于其内置的代码签名和应用程序审查等机
由于无线通信网络的开放性,使得传输信息被窃听的风险成为了一个非常值得关注的问题。物理层安全技术作为一种可以有效保证通信安全的技术,最近吸引了通信界的关注。物理层安
随着移动互联网时代的到来,无线通信系统需要为人们提供更高的可靠性、更广的网络覆盖范围以及更大的系统容量。中继MIMO通信系统依靠其多天线的特点,可以更高效的发挥中继站
近年来,随着“互联网+”在各行业不断的普及和发展,大数据思维正逐渐影响着人们的思考方式,领导者们依据数据作决策已成为常态。然而当前的大数据具有数据量大、类型繁多、变
公民政治参与是公民享有的重要民主权利之一,是现代国家政治生活的重要组成部分。政治参与思想最早可追溯到古希腊的政治学说,现代社会的政治参与是衡量一个国家民主与否程度
会议
近年来,自适应网络的研究和应用受到越来越多的关注和重视。为了解决自适应网络中的参数估计问题,人们提出了许多有效的具有创造性的算法。基于分布式架构的扩散LMS算法是其
目的:本文通过整理颈椎病的相关文献资料以及动物实验研究两方面来探讨项七针对颈椎病的作用机制。方法:将实验大鼠分为正常组、项七针穴组、非经穴组和模型组。项七针穴组针
教学是高校促进学生发展最有效的手段。提升教学水平,取得良好的教学效果,是高校关注的重点。学生作为教学的主体,是教学过程的直接体验者。为了提升学生的主体地位,彰显学生
随着智能手机的发展,各种新的业务如雨后春笋般爆发,智能硬件,物联网,互联网医疗,虚拟现实等技术无疑对通信技术提出了新的要求,传统的4G通信系统在系统速率,时延和可靠性等
本文以隐马尔科夫模型频谱算法为基础,针对现有的频谱检测算法中没有对计算复杂度进行更进一步探讨的现状进行分析的问题,对粒子滤波算法进行改进(结合贝叶斯近似方法),使得