多领域跨媒体科技大数据高效检索查询研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:looen01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过学者和科研人员的不懈努力以及信息化技术的不断发展和普及,互联网上迅速积累了海量的科技大数据。不同于互联网上爆发式增长的新闻、社交等信息,科技大数据有其独特的一面。科技数据主要以论文和学者信息等具有学术风格的资源为主体构成,其数量庞大但数据的冗余信息少,具有专业性强但不同领域间差异性大的特点。在对科技资源进行检索查询时,一方面由于科技大数据的独特数据特性导致了传统的检索算法难以满足学者用户的需求。另一方面,科技大数据的多模态以及异构性对科技资源的获取与处理提出了更高的要求。基于这样的背景,针对多领域跨媒体科技大数据的高效检索查询研究具有非常重要的意义。本文完成的主要工作如下:(1)提出了多模态科技大数据深度特征提取与表示方法。针对科技大数据中的文本资源,提出了基于密集卷积注意力的特征表示(FR-DCA)算法,利用密集卷积结构结合双向LSTM循环神经网络进行文本特征的深度提取;针对科技大数据中的图像资源,从图像输入尺寸的不一致问题出发,提出了利用含有空间金字塔池化的卷积神经网络进行图像特征深度提取。实验结果表明,所提出的两种科技资源特征表示方法在精确率、召回率和F1值等指标上普遍优于对比算法。(2)提出了多领域跨媒体科技大数据的语义空间学习及分析方法。基于所提出的密集卷积注意力模型和引入空间金字塔池化的卷积神经网络模型,提出了基于语义约束的科技资源多模态对抗学习(MASC)算法。MASC算法通过对文本和图像的切割,充分提取细粒度上下文信息,引入语义约束函数进行对抗学习,对保持跨模态语义相关性的公共语义空间进行建模。实验结果表明,基于MASC算法的跨媒体检索相较对比实验各项检索评价指标均有比较明显的提升。(3)提出了多领域跨媒体科技大数据检索查询、预测及可视化方法。首先针对科研领域的学者影响力计算问题提出了基于学者合作关系和引文影响力融合的专家学者发现(CF-Rank)算法。CF-Rank算法通过学者合作关系图和论文引用关系图的融合进行学者影响力计算,实验结果表明该算法在覆盖度和人工评判指标上均优于对比实验。然后提出了基于时间窗口注意力的科研领域学者兴趣提取(IE-TWA)算法,IE-TWA算法考虑了时间因素对科研人员研究兴趣的作用,提出时间窗口注意力机制对学者短期兴趣进行表示,实验结果表明算法对于学者研究兴趣的预测具有很好的效果。最后结合两种算法设计了基于二次重排序的科技资源检索查询机制,实现了对科技大数据的高效、精准、个性化检索。(4)设计并实现了多领域跨媒体科技大数据高效检索查询系统。该系统包括多领域跨媒体科技大数据获取与特征表示、多领域跨媒体科技大数据语义学习、多领域跨媒体科技大数据检索查询、预测及可视化三个模块,充分验证了本文所提出的一系列算法的有效性和可行性。
其他文献
目的 探讨孟鲁司特钠口服联合舒利迭雾化吸入治疗小儿咳嗽变异性哮喘(CVA)的临床疗效.方法 选取河南省某医院2018年5月-2019年5月收治的100例小儿CVA患儿,采用随机数字表法分为实验组与对照组,每组50例.对照组患儿给予舒利迭雾化吸入治疗,实验组患儿在对照组基础上给予孟鲁司特钠口服治疗,比较2组患儿的临床疗效,咳嗽症状缓解和消失时间,复发率,不良反应发生情况,以及治疗前后第1秒用力呼气容积(FEV1)、用力肺活量(FVC)及FEV1/FVC.结果 2组患儿FEV1、FVC和FEV1/FVC高于治
目的 调查新型冠状病毒肺炎疫情下医护人员的职业倦怠情况,以了解其工作状态,为减轻其身心压力,提升其工作效能提供依据.方法 2020年1-2月,采用便利抽样方法,选取广东省29家三级甲等综合医院370名临床医护人员作为调查对象.应用MBI-GS职业倦怠调查问卷对调查对象进行问卷调查,并对调查数据进行统计分析.结果 调查对象个人情绪维度得分为2.0(1.0,2.6)分,去人格化维度得分为1.0(0.3,1.8)分,个人成就感维度得分为1.2(0.7,2.8)分.不同科室、职业类别、年龄及职称的调查对象其MBI
20世纪二三十年代,中国音乐文化发生了巨大的变化,显著的特点体现在音乐思潮的不断涌现。全文将从国粹主义思想、整体西化思想和中西兼容思想、国乐改良思想四个方面来论述中国音乐思潮对中国音乐文化所产生的影响。客观地评价了20世纪的中国音乐思潮。
目的 分析剖宫产手术椎管内麻醉后发生低血压的危险因素,为临床治疗制定防治策略.方法 选取2019年5月-2020年5月在沈阳市某医院妇产科行椎管内麻醉剖宫产的160例产妇为研究对象,按照行椎管内麻醉后是否发生低血压将产妇分为低血压组与非低血压组,对麻醉后低血压危险因素进行分析.结果 160例剖宫产产妇中,共有71例产妇行椎管内麻醉后发生低血压,占比44.4%;单因素分析结果显示,2组产妇麻醉方式、术前心率、妊娠前体质量指数(BMI)、妊娠后体质量增长量比较,差异均具有统计学意义(P<0.05);多因素Lo
目的 探讨富血小板血浆(PRP)治疗对慢性难愈合创面患者创面恢复的影响.方法 选取2019年7月-2021年2月达州市某医院诊治的86例慢性难愈合创面患者为研究对象,根据随机双色球分组法将患者分为对照组和研究组,每组43例.对照组患者行常规换药处理,研究组患者行PRP治疗.比较2组患者住院时间、创面完全愈合率,以及治疗90 d时的创面长度、宽度和深度.结果 治疗前,2组患者的创面大小(长度、宽度和深度)比较,差异均无统计学意义(P>0.05).治疗90 d时,研究组患者的创面大小(长度、宽度和深度)均明显