DL环境下的信息资源管理及知识发现研究

被引量 : 0次 | 上传用户:sun200208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数字图书馆下的信息资源组织建设问题,论文从信息资源的管理方法及网络信息的数据挖掘技术两个方面进行了研究。 首先从信息资源数字化、多媒体化、网络化等方面分析了数字图书馆信息资源的特点及现行编目方法在网络信息资源描述方面的局限性,并在此基础上阐述了用于数字图书馆信息资源描述的元数据方法;阐述了元数据的定义、类型、结构、编码语言等基础理论;研究了元数据的互操作性。对典型元数据方案都柏林核心集的应用进行了分析,探索了都柏林核心集元素的格式与应用;比较了都柏林核心集与现行编目方法的异同;并对网络信息资源的整序问题进行了讨论。 在网络信息的数据挖掘技术方面,针对传统向量空间模型存在的不足,运用模糊数学相关概念构造了模糊特征向量空间模型,提出了文档模糊特征提取及模糊特征向量的构造方法;提出了基于模糊向量空间模型的三种聚类算法:K均值聚类算法、核聚类算法、基于蚁群智能的聚类算法。其中,K均值聚类算法与核聚类算法需要预先给定聚类数目,通过不断迭代修正聚类中心,使聚类趋于稳定和精确;蚁群聚类算法无需预先给定类数,而是依据文档相似度,让蚁群携带文档移动。蚁群合作可表现出高度智能性,可以较好的完成聚类任务。应用人工智能领域的模糊逻辑、神经网络、机器学习等理论,提出了三种文档信息资源的自动分类方法:基于加权模糊推理网络的文档自动分类算法;基于自组织特征映射网络的文档自动分类算法;基于级联式支持向量机的文档自动分类算法。前两种算法首先依据已知类别的若干分类样本,构造满足输入输出关系的分类网络,然后应用不同的迭代算法完成网络的训练。加权模糊推理网络采用高斯-塞德尔迭代法求解满足输入输出映射关系的一组权系数。自组织特征映射网络采用无教师和有教师相结合的方式获得网络的分类能力。支持向量机分类算法具有较高的泛化性能,但是只能处理两类模式分类问题,级联式支持向量机可处理多个模式的分类。以上每种算法均给出了详细的分类原理和实施方案,实验部分证明了算法的有效性及可行性。 最后,论文提出了加强数字图书馆管理及知识发现的一些对策。
其他文献
目的观察并比较国产和进口门冬氨酸钾镁对低钾血症患者的补钾疗效。方法选择2012年7月至2013年7月医院低钾血症患者104例,随机分成3组,即进口组(40例)、国产组(34例)和对照组(30例
目的:探讨门冬氨酸钾镁联合美托洛尔、胺碘酮对心肌梗死合并心律失常患者血液动力学、血清磷酸肌酸激酶同工酶(CK-MB)、心肌肌钙蛋白I(cTnI)水平的影响.方法:将我院2014年5月
科技人才绩效评价是科技人才评价的一部分,与一般企业员工绩效评价大不相同。本文采用文献研究、深度访谈和问卷调查相结合的方法,构建了兵团科技人才"德、能、勤、绩、学"五
从煤炭企业成本管理现状分析入手,指出煤炭企业实施成本精细化管理的必要性,从煤炭企业实施内部市场化与目标成本管理相结合的角度,探讨了煤炭企业成本精细化管理的方法与策
从音乐角度完整梳理戏曲声腔的专著,在戏曲及戏曲音乐研究中尚未见有。如此现状,为本论文提供了很大的研究空间。 笔者以“全国戏曲音乐集成”卷本为对象,根据入卷声腔的
随着二十世纪七十年代各国服务业的迅速发展,服务贸易在世界经济和贸易的发展中发挥了重要的作用,国际服务贸易也被纳入多边贸易谈判的议程中。服务贸易成了国际贸易竞争的新
目的研究不同剂量布托啡诺鞘内注射对大鼠福尔马林诱导的疼痛行为学的影响,从而探讨其抗伤害作用机制。方法在15只健康SD大鼠的左后足掌面皮下注射福尔马林致痛大鼠被随机分
<正> 随着五天工作制的实行,人们的休闲时间增多了,休闲食品也随之在都市里走俏受宠。 休闲食品,顾名思义是专为休闲者而准备的食品。过去,休闲食品多是在街面上挑担叫卖的瓜
婚姻制度发展的历史也是婚姻制度本身与现实相磨合适应的过程,制度的功能和理想在面对现实时总会有一定的差距,而事实婚姻正是这一“差距”的产物。也正是婚姻制度本身造成了
阐述了山西省煤炭工业的发展现状、对国民经济的重要贡献和存在的问题,认为建设大型煤矿是推动山西煤炭产业结构调整和实现科学发展的必然选择,同时,阐明建设大型煤矿、推动