基于专业文档管理系统中个性化推荐方法及应用研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:moon818882003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球信息化建设的加速,企业的专业文档管理系统在日常运作中会积累大量的电子文档。系统中文档数量的不断增加导致用户不能快速获取所需的文档,严重影响了企业的办公效率。面对系统中海量的文档资源,针对不同用户的个性化文档推荐子系统可以高效地帮助用户发现其感兴趣的文档。本文的重点是对个性化推荐子系统中的推荐算法做进一步的改进和优化研究,并用各项实验评估数据进行对比分析来证明改进算法的有效性;同时,文中也对专业文档管理系统中存在的个性化文档推荐子系统部分进行了详细地需求分析,逻辑结构以及主要数据库设计,总体以及各项功能模块设计研究。对于原有的协同标签推荐算法而言,并没有考虑用户的配置文件信息,不能针对特定用户进行个性化推荐而且准确性也欠佳。系统在标准的协同标签推荐算法基础上,通过融入图聚类方法以及信任信息来进一步提高针对特定用户的个性化文档推荐结果准确性。本文对原算法主要做了如下两个方面改进:(1)文中在对大量的用户以及文档标签进行分类处理的过程中,通过引入近似最密集子图聚类方法将所有的标签生成若干个标签簇,使得簇内标签彼此相似且不同标签簇彼此相异,提高了原算法对大数据集的处理效率以及对未知推荐对象的挖掘能力。(2)文中将用户对不同标签簇的信任信息引入原算法中,在原算法的基础上线性组合用户的信任信息以及其对文档资源的兴趣度来生成每个文档的个性化分数。不仅能让系统针对特定用户进行个性化的文档推荐,而且在推荐结果的准确度上也有所提高。在两种不同数据集下,通过将HTGCPR算法与KMCPR、TCFR算法的各项实验数据进行对比分析和评估,结果表明个性化组合推荐方法的应用满足了用户对文档推荐实时性和准确性的要求,在一定程度上提升了用户的体验。
其他文献
miRNAs在很多生理和病理过程中发挥重要功能,miR-155作为miRNAs中的一种,作用重大,在肿瘤中,是最常见的上调miRNA之一。而且,作为一个与肿瘤相关的miRNA,miR-155已被报道存在于多种人类癌症中。miR-155由位于染色体上的B细胞整合簇基因产生,关于它的研究有很多,它被看作是典型的多功能miRNA,可以调控多种肝脏疾病,比如肝损伤、脂肪变性和肝纤维化等。除了这些,miR-
颈部淋巴结作为重要的免疫器官,是淋巴结疾病的好发区。因此在临床诊断上对颈部淋巴结的检查具有十分重要的意义。超声成像技术因其成像过程简单、实时、经济等优点成为了颈部淋巴结检查的首要选择方式。但因为超声成像技术中混响伪影,超声斑点噪声的所带来的缺陷,导致医学超声图像模糊不清,在人工检测疾病时存在较大的主观性。因此,有效地对颈部淋巴结超声图像进行相应的处理,通过自动分割获得感兴趣区域,并进行相关的分析,
盐酸克伦特罗(Clenbuterol Hydrochloride,CL)属于β2型肾上腺素受体激动剂,常被作为违禁添加剂添加在动物饲料中,通过食物链直接危害人体健康,因此,畜产品中CL残留的快速检测对食品安全具有重要意义。纳米抗体具有敏感性高、稳定性好、筛选周期短等优点,在食品安全检测、生物医药等领域中具有良好的发展前景。本研究旨在构建基于噬菌体展示的天然纳米抗体文库,初步筛选靶向盐酸克伦特罗的纳
有理曲面的隐式化问题是一个经典的代数几何问题,在计算几何、计算机辅助几何设计与辅助制造中都有重要的理论价值和广泛的应用前景。1995年出现的Sederberg与Chen的动曲面方法是一个全新的隐式有理参数曲面的方法。Cox等人在2000年解决了用动曲面方法隐式化无基点且无低次动平面的有理曲面的有效性问题,2016年,Lai与Chen在其基础上提出了用动平面生成动二次曲面的算法,大大提高了隐式化的效
钛合金具有比强度高、工作温度范围宽和腐蚀抗力优异等特点,广泛应用在飞机发动机上。如发动机压气机盘、压气机叶片和风扇叶片的首选材料。发动机钛合金零部件主要承受疲劳载荷谱,掌握其在变幅载荷作用下的疲劳行为具有重要意义。当前,恒幅载荷下钛合金的裂纹扩展特性研究较多,而对于变幅载荷下疲劳裂纹扩展特性的研究较缺乏,针对TC4-DT钛合金在恒幅过程中加入单个拉伸超载条件下的裂纹扩展特性开展了研究。本文进行了恒
心血管疾病具有极高的发病率与致死率,药物治疗及外科手术均不能有效地解决问题,同时自体移植与异体移植受到来源与免疫原性的限制。所以,组织工程与再生医学被视为最有希望解决心血管疾病的方法。血管组织工程支架在心血管治疗方面展现出了较多优势,大直径(内径>6mm)血管的体外培养与移植已获得了较好的临床评价,但是小直径(内径<6mm)血管组织工程支架仍然存在着很多问题,例如力学性能与可降解性能不佳、长期通畅
随着后基因组时代的到来,膜蛋白类型预测问题作为蛋白质组学中的重要议题成为一个新的研究热点。在膜蛋白类型预测研究中,面对不断增加的庞大的数据量,通过生物实验等传统方法进行膜蛋白类型预测已经逐渐不再适用。本文以机器学习方法为基本,从数据的特征表达入手,将膜蛋白序列转化为能够输入到机器学习算法中的特征向量,并使用多种预测模型与集成方法以此获得更好的预测性能。本文主要内容包括特征的提取与高效利用、集成策略
随着人们生活水平的提高,对肉类、蛋类以及奶产品安全性的关注日益高涨,寻找安全有效的抗生素替代品作为绿色饲料添加剂的必要性愈发迫切。本研究以秃疮花(DLF)为主要原料,对其作为绿色饲料添加剂的应用前景进行了探索。首先,使用控制变量法,设置梯度试验,从而对DLF中生物碱的提取工艺进行优化。随后,采用实验所得的最佳工艺对不同器官中异紫堇碱(ICD)含量进行比较。其次,以DLF为主要材料配合其它中药分别设
沙丁胺醇(Salbutamol,SAL)是人工合成的一类肾上腺素药物,常被非法作为饲料添加剂用于畜产品的生产,给我国动物源性食品安全带来巨大威胁。单链抗体(Single-chain variable region fragment,Sc Fv)因具有分子量小、操作简单而且生产成本低等特点,已逐渐成为建立免疫学快速检测方法的重要研究对象。因此,本研究旨在利用噬菌体展示技术构建鼠源免疫噬菌体单链抗体库
低噪声窄线宽光源在光通信和高精度传感领域有着广泛的应用,光源的噪声特性和相干性直接影响着通信系统性能和传感测量精度。外腔结构的窄线宽半导体激光器通过增大腔长,适当引入外腔光反馈,有效地实现了噪声抑制和线宽压窄,是目前较为理想的一种光源。本论文从外腔选频原理出发,基于传统外腔半导体激光器基本模型,介绍了一种新型标准具选频结构的外腔半导体激光器,深入研究分析了其输出激光的线宽和相位噪声特性,并在此基础