面向小样本的科技服务推荐系统设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhongguoidc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技服务业是在创新驱动与产业融合的趋势下形成的一种新兴服务产业,是助推科技成果转化与经济发展方式转变的重要手段。科技文献服务与专家咨询服务是科技服务应用的重要分支,能够满足相关技术人员及企业对科技文献检索、科研成果发现、专家技术咨询及交流与合作等需求,为其提供专业的技术支持。科技信息数据存在专业性高、针对性强、学科间交叉广泛等特点,且具有较高的时效性要求,因此,科技服务推荐面临着文本数据稀疏、特征维度高、推荐可解释性差等挑战。传统的推荐算法在实际应用中存在特征提取困难与推荐冷启动等困难,对于解决科技服务推荐问题的适用性有限。本文重点研究面向小样本场景的科技服务推荐,主要研究内容如下。(1)针对科技文献推荐服务,提出面向科技文献的主题演化与用户偏好推断方法。首先,通过将时间序列融入传统的主题模型中,提取科技文献的主题特征并计算主题分布,推测科技文献主题的演化趋势;其次,利用科技文献推荐场景中包含的大量用户查询关键词,建立查询关键词与查询结果之间的语义映射关系来推断用户的短期动态偏好;最后,通过对用户长期历史记录和短期偏好的联合建模,完善用户特征,缓解用户数据稀疏造成的推荐冷启动问题。(2)针对专家咨询服务,提出基于科技服务知识图谱的会话推荐方法。首先在真实的专家与科技文献数据场景中构建科技服务知识图谱,并完成知识图谱的实体嵌入;其次,在会话推荐技术中结合本文提出的用户偏好推断方法,利用专家咨询场景中实时的会话上下文文本识别准确的用户需求;最后,构建知识图谱中的实体与推荐任务中的项目二者之间的潜在信息共享单元,利用知识图谱中的辅助信息,增强小样本场景下的推荐准确性与可解释性。(3)完成科技服务推荐系统的设计与实现。该系统主要包含数据采集与处理、用户检索、在线推荐、热门推荐等模块,能够为科研工作者推荐满足需求的科技文献与专家,还能够根据用户反馈推荐用户可能喜欢的科技文献,并展示近期热点研究方向,为用户提供专家咨询服务等,通过系统测试验证了该系统功能的完整性与有效性,能够达到预期目标。在后续的工作中,本文将深入研究用户自然语义偏好对齐方法和多维度复杂用户行为预测方法,进一步缓解科技服务推荐中的样本数据不足与冷启动问题,同时集成更多的科技服务应用来提高系统的可扩展性,从而构建一体化的科技服务平台。
其他文献
随着我国水利信息技术的发展,水利领域中出现了越来越多的优秀系统,这些系统在近些年来积累了海量的水利领域相关数据,这些数据大多都储存在各自的系统之中,没有被充分的利用起来。知识图谱技术具有强大的语义处理和互联组织能力,可以有效的将这些积累的数据组织起来,充分挖掘数据价值,实现水利信息资源的高效利用。知识图谱可以认为是由本体与数据组成,对本体进行数据的填充即构成了知识图谱。本体的构建可以认为是知识图谱
学位
随着社会数字化的推进,传统金融行业与互联网技术的融合不断加深,新兴互联网金融为金融行业发展注入新的活力。命名实体识别技术可以从海量的金融信息中挖掘出有效的信息,在促进智慧金融发展、提升金融服务质量、满足多元化投融资需求等方面发挥积极作用。然而,现阶段的命名实体识别模型针对中文互联网金融领域的研究较为匮乏,不能有效识别出金融实体,进而影响金融行业获取信息的效率。本文结合中文互联网金融领域文本语言结构
学位
OpenCL凭借其开放性和代码可移植性成为异构并行计算中热门的并行编程框架。OpenCL程序不具备良好的性能可移植性,当OpenCL程序跨平台移植时需要重新对其进行参数优化,该过程耗时耗力,故OpenCL程序的参数自动优化一直是研究重点。在OpenCL程序参数自动优化中,存在调优参数选择不合适而无法有效发挥设备性能的情况。在搜索空间的选择上通常会选择较大的搜索空间以保证对多种设备的兼容性,该方式会
学位
近年来,数字出版已经形成了较为完整的产业链,供给方通过将物品的使用权让渡给使用方,并以此获取一定回报。然而,由于这些多媒体数据多是由数字图像、视频、音频和文本组成的,在网络传播的过程中极易泄漏和篡改。作为保护作品版权的主要方式,数字鲁棒水印技术在保护数字版权领域中有着举足轻重的地位。现行水印方案的时间性能受限于运行设备的计算能力,运行空间以及图片规模等因素难以发挥出全部的性能,限制了水印技术的广泛
学位
随着中国数字产业的持续发展,网络化软件已然成为当下软件工业化的主流应用。而当下庞大的软件规模和软件单元之间的复杂异构关系使得软件在运行期间所涉及到的资源可能会随时发生变化,一旦软件在运行过程中出现无法承受巨大的压力出现宕机情况,企业乃至于社会层面付出的代价将是无法估量的。因此如何让网络化软件在运行过程中自行分析软件状态或环境状态变化,实现软件在线自优化,成为目前软件工程领域的巨大挑战和热门研究课题
学位
随着互联网和人工智能技术的快速普及与发展,数据信息的收集与共享日渐频繁,各大机构根据已发布的数据通过数据挖掘技术发现用户的潜在行为和需求,推动精准服务领域的发展,而由此带来的数据安全问题也愈发严重。一方面,公开的数据中包含敏感信息,考虑到敏感信息内隐含了用户的身份信息,财产流水等隐私,因此数据发布者须对真实数据进行隐私保护后再发布。另一方面,数据发布的目的是使用数据并产生相关的价值,隐私保护后的发
学位
在自动驾驶领域,对路面上小障碍物检测,能够帮助汽车躲避障碍保证驾驶安全。随着具有辅助驾驶功能的新能源汽车的推广和普及,小障碍物的检测定位越来越具有意义。然而小目标在图像中占有的像素少、边缘信息模糊,使得关于小目标检测的研究充满挑战。本文创建了路面小目标障碍联合数据集,数据集中驾驶场景丰富、目标种类多样、小目标占比超过90%。目标检测算法在小目标联合数据集上的性能作为衡量算法对小目标检测性能的标准。
学位
随着互联网的发展,各种应用的业务逻辑变得更加复杂,涉及到的数据急剧增加,对数据库性能的要求也越来越高。在当前国际形势下,为避免核心技术受制于人,数据库系统软件国产化已是必然趋势,Gauss DB采用大规模并行处理架构,同时支持行存储与列存储,并提供PB级别数据量的处理能力。openGauss作为Gauss DB的开源版本于2020年7月发布,集成了机器学习结合数据库调优的技术,其中智能索引推荐技术
学位
20世纪以来,空调机组的使用率大大提升。而其中的工厂级空调机组由于重要性之高与故障损失之大总是让管理人员为运维而发愁。为了更好的节省成本与保障安全,设备的故障分析与健康管理方式早就引起人们的关注。而相关的技术研究中,设备运维显然是最重要的课题。研究表明,当前大部分的设备运维依旧采用着“先损后修”的方式,这样的维修方式存在着安全性不高、耗费代价过大等恶劣影响。而新一代的运维思路,即“定时维修”。虽然
学位
三目标水库调度是一个复杂的多目标优化问题,其复杂性主要体现在决策空间和目标空间两个方面。决策空间层面的复杂性主要体现在决策变量的序列维度高,并且各个决策维度之间存在链式相关性;目标空间层面的复杂性主要体现在各个目标求解过程中存在难度差异,使得最优化解集分布不均,导致帕累托前沿面的形状复杂。决策空间和目标空间的求解复杂性,致使三目标水库调度问题的求解不够高效。因此,本文围绕如何高效求解三目标水库调度
学位