基于数学表达式特征的科技文档检索模型

来源 :河北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:ye77hao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有全文检索技术多是以文本信息为处理对象, 对于以数学表达式为主要成分的科技文档检索还处在探索阶段. 为了使用户可以方便地以数学公式作为查询语言对科技文档进行检索, 提出了一种基于数学表达式特征的科技文档检索模型. 首先通过将公式解析为二叉树得到数学表达式的子式信息, 利用数学表达式及子式构造检索特征向量; 在索引阶段, 利用所提取的文档特征向量构建分层结构的索引表; 在匹配阶段, 对文档向量采用t f - i d f 进行加权操作, 利用余弦相似度对检索向量和文档向量进行相似度计算, 得到一个有序的文档
其他文献
“互联网+”时代,高校信息化建设逐步发展为以“云计算”为基础平台,以服务为核心,以用户体验为导向,创新服务信息化,享受“一站式”模式带来的高效、全面、便捷的服务。该文
光电稳定平台常采用两轴四框架的结构形式扩大稳定跟踪范围和提高跟踪精度,内外框架之间由于机械结构连接产生耦合,为建立稳定解算方程,分析两轴四框架光电稳定平台的工作原理,通
建立了高效液相色谱-串联质谱法同时测定豆芽中6-苄基腺嘌呤、4-氯苯氧乙酸、2,4-D、赤霉素、1-萘乙酸、2-萘氧乙酸、吲哚乙酸、噻苯隆等8种生长调节剂残留量的方法。样品用
目的设计适用于医学统计学课程中'文献统计学错误辨析'教学环节的评价量规(rubric),为促进学生有效学习制定合适的评价工具。方法根据教学特点设计量化rubric,应用Cr
以从水稻根部分离到的1株解淀粉芽孢杆菌WH1为材料,通过红外吸收光谱对其发酵液中的抗菌活性物质进行了鉴定,并通过平板抑制试验和离体叶片防治试验,研究其发酵液对油茶炭疽
参数的选取是影响IPR曲线定产合理与明,利用参数优选后的不稳定IPR曲线确定试采定产,与实际试采产量的符合率达100%.
分析了奥氏体不锈钢焊接过程中容易出现问题(晶间腐蚀和热烈纹)的原因;介绍了防止和减少晶间腐蚀、热烈纹的常用措施;讲述了奥氏体不锈钢焊条电弧焊时的注意事项。
随着网络时代的到来,网络舆论迅速出现。一方面,网络传播使公众在网络中获得前所未有的广阔的舆论空间和更多的舆论自由,促进了社会民主化的进程;另一方面也引发了网络虚假信
在水平油气井完井投产时,需要及时进行多点或单点产能测试,确定水平井绝对无阻流量和产量与井底流压的IPR关系曲线。考虑到产量的需求和成本的节省,在水平井投产时,往往只进
抗日战争爆发后,中国政府极需要从其他国家得到军事援助,于是接受外援的国际交通路线的地位显得十分重要。抗战时期的西北国际交通线,是一条最安全可靠的路线,通过这条路线中