基于智能主题图的科技文献细粒度知识组织与检索方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:BecauseArc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技文献海量的今天,大多数科技文献检索系统仍采用以篇为单位的方式描述和组织文献,这种知识组织方式缺乏对文献内容语义的丰富描述与组织,不能满足用户精准化的知识需求;此外,科研人员在对科技文献进行检索时,检索系统反馈的是整篇科技文献,科研人员需要花费大量时间和精力在每篇文献中寻找需要的知识单元,这一检索方式不能满足科研人员们精准化的检索需求。为了实现对每篇科技文献内部内容的语义导航,向用户提供精准化的检索内容,对科技文献内部知识进行细粒度知识组织和检索变得更加迫切。本文将围绕科技文献细粒度知识组织和检索方法进行研究工作。首先,本文在分析现有的科技文献知识组织方法的基础上,结合智能主题图的特征,构建一种科技文献细粒度知识组织方法。该方法在分析文献集合的内部内容特征基础上,抽取文献内部的主题以及知识单元,将文献集合划分为资源层、知识单元层、主题层以及聚类层,并采用全信息相似度方法计算主题及主题之间的关联、知识单元及知识单元间的语义关联;其次,在前期研究的科技文献细粒度知识组织方法基础之上,提出了一种针对科技文献知识单元集与用户检索式的科技文献检索方法。该方法基于Word2vec和自动阈值的方法对用户查询式进行预处理与查询扩展,通过查询扩展筛选出关联度较高的词语加到原查询中组成新的查询词,接着采用基于概念特征以及信息量特征相结合的方法来计算查询词与科技文献细粒度知识单元集之间的相似度,并按一定阈值的相似度返回检索结果;再次,对科技文献细粒度知识组织方法与检索方法进行实验研究,采用提出的方法对实验数据集进行细粒度组织,在此基础之上,对本文提出的检索方法进行验证,并与基于关键字的检索方法结果进行对比分析。实验结果表明,本文提出的科技文献细粒度知识组织与检索方法能对知识单元进行较为准确的导航与检索。本研究提出的科技文献资源的细粒度知识组织与检索方法,丰富了科技文献组织和检索的理论,有利于组织科技文献的内部知识,定位科技文献中的知识点,帮助用户节约检索时间,提高用户获取信息的效率。
其他文献
区块链技术被认为是近年来最具颠覆性和革命性的技术之一,具有去中心化、防篡改、开放、自治、公开可验证等特性,成为学术界、企业界和政府部门研究的热点。区块链交易的公开可验证虽然保障了去中心化和自治性,但透明的交易信息与确定的资金流向会泄露用户的隐私。Zcash、Monero等具有隐私保护功能的密码货币应运而生,实现了用户身份的无条件匿名。然而,这种无条件匿名性在保护用户隐私的同时为不法分子的恶意行径提
学位
随着科技的不断进步,电子产品更新迭代速度在加快,废旧产品的闲置与弃用加速了资源的浪费与环境的污染。生产者责任延伸制的出现使得制造商需要对产品的全生命周期负责。从回收上看,制造商一般会选择自行回收或是和第三方回收商进行合作来完成产品的收回工作;从再制造上来看,制造商会通过自主再制造生产或交给第三方独立的再制造商来完成。为了研究再制造产业对供应链成员所带来的影响,本文研究了市场细分下和外包条件下的再制
学位
由于清洁、高效、便利的优势,天然气在能源系统中占据了重要位置。能源市场的转型、天然气产业链的发展以及节能环保政策,既给天然气行业的发展带来了机遇,也带来了挑战。天然气供需失衡、天然气进口量的增加、天然气价格改革等冲击着天然气市场。天然气市场的稳定性对我国能源经济发展和清洁能源建设有着重要的影响。同时天然气的发展有利于推进能源转型、实现中国碳达峰和碳中和的目标。城市燃气作为天然气产业链中的重要一环,
学位
近年来,中国采取了有针对性的措施来促进智能制造的发展,并为传统制造企业的智慧工厂建设指明了新的方向。智慧工厂的提议将连接产品与制造业之间的关系,并将在与智能制造的联接方面发挥承上启下的作用。在当今互联互通的时代环境下,当公司的能力达到一定程度之后,则会通过全球化来把资源进行更好的分配,减少成本消耗的同时也能提高效率。要寻求全球优质、低成本材料供应的地方,除了考虑销售费用和生产费用外,我们还要注意到
学位
移动互联网的蓬勃发展带动着平台业务的升级与转型,行业中由于平台数量增多及结构多样化所造成的不同竞争形态对各平台的运营策略提出挑战;再者,有别于传统市场为吸引消费者而以较低价格创造较高使用价值,平台竞争具有多面性,其定价等运营策略影响着平台两侧的供求关系。这使得处于不同竞争形态的平台运营策略选择问题复杂且具有现实意义,本研究使用金字塔空间模型来描述多平台竞争及用户选择行为,以各平台利润最大化为目标构
学位
集成电路产业作为电子信息产业的核心,引领着前沿科技和新兴产业的融合方向。随着世界各国对战略性新兴产业的高度重视,中国集成电路产业的国产化进程迎来了新的机遇。然而,部分西方发达国家为维护自身产业领导地位,阻挠中国集成电路产业的国产化脚步。中国集成电路产业呈现出研发资金持续投入、而创新资源严重不足的局面。在此背景下,有必要基于产业特性搭建效率评估的多维指标体系,对企业的运营效率进行全面客观的评价,并进
学位
随着信息技术的快速革新,信息资源价值也逐渐显现,公共信息资源开放已成为当今社会各界关注的焦点及各国信息化发展的必然选择。为契合时代发展要求,我国政府也颁布了大量政策,但相较于其他西方国家,我国公共信息资源开放目前仍处于初期阶段。因此为进一步加快我国公共信息资源开放进程,必须制定并完善配套的、科学合理的政策体系,从而为我国公共信息资源开放工作的全面展开提供重要保障。为此本文以我国中央及三大经济圈地方
学位
血液作为临床医疗的必备品,除了具有生命周期短、供需不确定等特征,还具有短缺浪费严重的现象发生。突发性事件是临床上不可控的因素之一,而在此之下血液的应急保障是为了高效且安全地满足合理用血,最大程度地减少资源浪费、人员伤亡的重要措施。而稀有血液因其特殊性,其库存保障是临床医学工作中亟待解决的重要问题。要做到最大限度地提前预估及预判,就要及时准确地掌握医院血库中稀有血液的库存以及日常消耗情况。通常为了应
学位
移动互联网的迅速发展扩充了包括但不限于文学、艺术等享有版权的作品的展现形式及分发渠道。用户对于这类作品及其衍生品的需求程度也极大的提高,作品的版权价值随之大幅提升。对于版权作品的盗版、侵权等行为不断涌现,严重打击了创作者的积极性,对作品的价值也产生了负面影响。版权行业对于版权保护的需求日益提高。现有的版权保护模式存在申请周期过长、成本过高、限制传播渠道等缺点,使得新兴的以数字媒体、互联网方式流通、
学位
经济全球化和消费需求差异化的快速发展致使产品市场的竞争日趋激烈。激烈的竞争驱使制造企业寻找合适的上游供应商并与之建立长期的战略合作关系,以满足市场需求,提高生产效率和产品质量,进而强化供应链的竞争优势。而信息的通透性是影响供应链绩效的关键因素。信息作为供应链的载体,对上下游企业间的合作和资源的有效利用作用重大。长期以来,由于信息不对称和节点企业利益不一致的普遍存在,下游的制造商与上游的供应商一直处
学位