分类效率相关论文
对新书进行分类时,可以利用数据库进行查重,辅助分类,既省时省力,又提高分类效率
When classifying a new book, the database can be......
当前文本分类方法由于没有考虑页面之间相互关系,因而分类效率有限。鉴于此,受万有引力定律启发,提出基于万有引力定律和PageRank......
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具。九十年代以来,Internet以惊人的速度发展起来,它容纳了海......
在文本分类领域,常用的特征选择方法(如文档频率)是基于概率统计信息的。本文从一个全新的角度,即基于认知情境的语义框架的角度进行......
使用支持向量机对非线性可分数据进行分类的基本思想是将样本集映射到一个高维线性空间使其线性可分 .基于 Jordan曲线定理 ,提出......
针对K-nn算法应用于文本分类时存在的问题进行改进,提出利用聚簇进行训练样本约减的方法,并用神经网络实现改进的k-nn分类器。实验......
支持向量机(SVM)是基于统计学习理论提出的一种有监督的机器学习算法。其使用结构风险最小化原则,在解决小样本问题中具有诸多优势......
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器......
随着人脸检测技术的发展,各种人机交互系统在日常生活之中得到了广泛的应用,并且人们也对于人机交互技术提出了更高的要求,即在人......
基于二叉树的支持向量机多类分类算法虽然在目前现有的多类分类算法中总体性能较优,但是仍然存在分类精度和分类效率不高的问题。......
当前图书馆书目信息管理大都是通过硬盘等存储器,对海量图书信息进行处理,但是信息输入的效率远远低于图书信息产生效率,使得书目......
针对科技论文具有半结构化的特点,提出利用科技论文的元数据的多层次分类模型.这里元数据包含论文的标题、关键词集合和摘要等信息......
为了解决ID3算法运算复杂及效率低的问题,引入高等数学中的泰勒公式,在ID3算法的基础上提出了ID3简化算法,使运算变得简洁,提高算......
训练样本集中异常样本的存在会使得支持向量机分类超平面过度复杂,降低了分类器的分类效率和泛化性能,在分析这种问题产生原因的基......
主流的图结构数据分类算法大都是基于频繁子结构挖掘策略。这一策略必然导致对全局数据空间的不断重复搜索,从而使得该领域相关算法......
针对数据采集过程中的数据分布不平衡的问题,对非平衡数据应用数据挖掘分类算法进行分类。传统的分类器在处理非平衡数据时分类结......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
基于包含全部特征的类别特征数据库,利用基于距离度量的Rocchio算法、Fast TC算法和基于概率模型的NB算法,从定量的角度来分析停用词......
基本k近邻(kNN)分类算法具有二次方的时间复杂度,且分类效率和精度较低。针对该问题,提出一种改进的参考点kNN分类算法。依据点到......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......