【摘 要】
:
在现有相关研究的基础上,提出了一种基于数据库分类的DeepWeb爬行器框架,该框架首先从抓取的网页中识别出信息查询表单,然后对表单对应的Deep Web数据库进行分类,并根据分类结果来选取一组合适的
【机 构】
:
郑州大学信息管理系 郑州 450001
论文部分内容阅读
在现有相关研究的基础上,提出了一种基于数据库分类的DeepWeb爬行器框架,该框架首先从抓取的网页中识别出信息查询表单,然后对表单对应的Deep Web数据库进行分类,并根据分类结果来选取一组合适的
其他文献
我国集装箱港口群区域中主体分工不明确、低水平重复建设造成港口岸线资源的浪费等现象日益突出.本研究以集装箱港口群与腹地运输成本和港口建设成本为主要优化目标,在分析港口群运营效率、港口-腹地供需平衡、生态承载力等约束下,建立了集装箱港口群多期投资优化决策理论模型,填补了集装箱港口群投资优化决策理论的空白,从而防止港口群区域内不理性建设和竞争造成对资源的巨大浪费和生态环境的破坏,具有实际应用现实意义.
在分析科技评估机构核心竞争力的基础上,将知识管理的有关理论和方法应用于我国科技评估机构,提出在科技评估机构构建知识管理体系,以整合科技评估机构自身资源,提升核心竞争力,实现可持续发展.
科技发展规划对国家科技发展起决定性作用.本文从规划目标角度对我国科技发展规划的现状进行分析,发现1)我国国家科技发展规划中的量化目标体系仍需完善;2)我国国家科技发展规划的目标与各省、市、自治区的科技发展规划指标体系之间协同性较低.通过公共治理中关于治理主体、治理工具、治理结果和治理机制等方面,提出我国科技规划治理改善策略.
上海市经济要想进一步快速发展,除了重视物质资本投资外,还应向人力资本投资的方向发展.因此,本文从人力资本的角度入手,首先介绍了人力资本的定义,然后分析人力资本对经济增长的贡献度,并从中得出基于卢卡斯内生增长模型的新模型,运用新模型来分析上海市人力资本与经济增长的关系,最后根据实证分析结果,提出相应的人力资本政策.
本文分析了叙词表的运行、使用环境的变化。结合叙词表在面向网络、面向用户、面向自动标引的需求,探讨了叙词表编制实践中应该注意的一些问题,并提出了相关的解决办法。
在文献分析领域,随着数据规模的日益扩大,传统意义上的数据分析已经变得越来越难以实现。同时随着网络科学的发展,基于链接的数据分析技术越来越受到人们的重视。本文给出了DBLP作者合作网络的一个分析范例。首先,我们统计了该网络的一些基本统计特征,如度分布,边的权重,以及聚类系数的分布等,并通过可视化技术分析了该网络中的高产作者、作者重名现象以及频繁合作关系等。通过以上的分析,本文列举了一些有趣的特征,如
网络知识组织系统(NKOS)是知识组织领域的前沿研究课题,其目标是研究与开发适用于网络信息环境的、服务于数字信息资源组织的知识组织工具。2010年国家数字图书馆工程启动了中文网络知识系统(CNKOS)规范建设项目,其目标是在继承国家图书馆现有的知识组织资源的基础上,借鉴国际相关研究与实践,提出适用于中文网络知识组织系统的构建规范,以推动国内网络知识组织系统的研究与应用。具体内容包括:1)对传统的知
本文从基于对事物的理解和上下文的知识价值链及增值实现角度,探讨知识服务的本源构成及内涵实质,研究基于资源维(Resourcesdimension)、层次维(Hiberarchy dimension)和生命周期维(Life cycle dimension)三个维度的知识服务理论构架,进而论证支撑知识服务实现的关键技术体系,对国内外知识服务研究的热点进行
在汇集整理数字资源选择标准初始集合的基础上,开展专家问卷调查,进行数字资源选择标准重要性及适用性的调查研究,采用因子分析法进行数据统计和分析,提炼精简出关联度最强、最具代表性的选择标准,在此基础上遴选适用性得分高于4分的选择标准,由此构建具有一定合理性和可操作性的数字资源选择标准体系。
本文分析了目前网络环境下,信息组织工具所带来的信息组织困境,并针对性地开展了相关的理论研究和实践探索,提出了构建统一分类词表体系的解决方案。在深入阐述统一分类词表体系概念、特征、结构、特点及作用的基础上,具体介绍了在国防科技信息领域构建统一分类词表体系的途径和取得的阶段性成果,指出了词表体系下一步发展的方向。