【摘 要】
:
随着Web资源的迅速增长,互联网中的信息越来越丰富。Web信息资源分类的质量将直接关系着现有信息资源能否高效的服务于信息需求者,所以Web信息资源分类技术的研究具有重要的
论文部分内容阅读
随着Web资源的迅速增长,互联网中的信息越来越丰富。Web信息资源分类的质量将直接关系着现有信息资源能否高效的服务于信息需求者,所以Web信息资源分类技术的研究具有重要的实用价值。Web信息资源质量即将成为网络资源泛滥时代热门的话题。本文为了提升信息资源的预见性,提出一种补偿式资源质量评价方法,对庞大杂乱的资源进行有机地分析、评价和分离,将资源的质量特征与特征提取算法、分类算法等进行有机融合,以减少预处理、分类过程中各种匹配带来的无谓开销,最大限度的提高过程的效率和质量。为提升特定行业Web信息资源分类的高效性、实用性,本文提出了一种面向特定行业的分类方法,借助行业知识库对行业术语进行语义转换,使其与行业主题特征形成映射关联,然后通过训练过程提取样本信息资源涉及的主题特征,利用互信息评价函数,计算出每个特征在对应类别下的权重系数,并结合特征分布均衡的情况对互信息计算方法进行了改进。接着利用VSM的TFIDF权重计算方法,对待分类信息资源的特征权重进行计算,最终通过特征权重与权重系数的计算值建立分类判别规则,以实现对行业信息资源类别的判定。本文还结合KNN进行了对比实验,验证了分类方法的有效性。最后,本文以改善资源分类机制、提升资源的易获性、准确性为目的,构建了一种高效、健全的Web政务信息资源分类系统,以多维索引目录为主导对分散的资源进行有机地映射、归类和存储。
其他文献
病毒检测与防御是计算机安全问题中的一个重要的研究课题。目前,病毒的花样不断的翻新,并大量的使用了多重加密壳、驱动关联壳、变形壳等代码保护机制以及多态和变形等新的技
关联规则挖掘作为数据挖掘的一个重要研究分支,由于形式简单、易于理解,且是从大型数据库中提取知识的主要手段,能够有效解决“数据丰富、知识贫乏”的现状,因而具有较大的理
一个能够加快搜索视频的速度的方法是搜索特定类型的视频。因此,我们十分需要能对这些视频进行归类的计算工具,以此缩小语义鸿沟。对视频进行精确归类需要视频数据的良好表示,且
不平衡数据集指的是数据集内各类样本点数目相差较大的数据集。使用传统的数据挖掘算法处理不平衡数据集存在着准确率低下、分类效果不佳的问题。SMOTE算法对不平衡数据集进
为支持我国科技事业可持续发展,国家设立各类科技项目,各级科技管理部门为此建立了众多科技项目管理系统,这些系统独立管理、封闭运行,因而也形成了众多的“信息孤岛”,无法
近年来,随着经济的发展、竞争的加剧,人们对知识的需求越来越强烈,通过网络进行的教育也越来越普及。网络教学逐渐成为人们进行学习的一种有效方式。而网络教学由于其本身的
我国经济日益发展,人口老龄化趋势逐渐严重,各种慢性疾病已经成为了老年人死亡的主要原因,而这些慢性疾病潜伏时间较长且随着年龄不断加重,为了防范于未然,居家健康呵护已然
随着第三代移动通信技术的飞速发展和普及,在移动通信领域中出现了越来越丰富的业务种类,除了传统的语音与数据业务外,多媒体业务、交互式数据业务、电子商务、互联网业务等多种
随着企业信息化发展进程的不断加快,目前越来越多的企业开始构建适合自身行业实际的企业应用集成架构,希望可以通过系统应用整合进一步满足日益增长的业务发展需求,消除企业