基于流形正则化的文档分类算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:qq503302228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于流形正则化框架提出一种分类算法(MLD-RLSC),以解决高维文档分类问题。该算法通过构建训练样本的最近邻图来估计数据空间的几何结构并将其作为流形正则化项,结合多变量线性回归获得高维文档的低维流形结构,并采用k近邻分类器对低维流形进行分类,得到针对多类问题的分类器。该算法能够充分利用训练样本的类别信息来帮助学习以提取有效特征。通过在Reuters-21578数据集上的实验,证明该算法的分类性能和运行速度比传统分类器有较大的提高。
其他文献
数据库安全功能独立性测试是评估者使用代表性测试用例在被测数据库管理系统(DBMS)上执行,并将DBMS内部数据修改和系统输出同预期结果作比较,完成DBMS安全功能实现的评估。给出
无线传感器网络中通常采用分簇路由协议来减少能耗,但仍然存在节点能量消耗快且不均匀的问题。鉴于经典的低功耗自适应集簇分层型协议LEACH的簇头选举过程中,没有考虑节点能
提出了一种全生命周期的软件可信性定量评估方法。首先,建立全周期软件可信评估模型,对生命周期各阶段软件可信性进行逐层分解,分别设计定量或定性度量指标;然后,利用知识发现原理
根据移动电子商务的特点,通过分析客户信任影响因素,给出了一种改进的移动电子商务信任预测流程;然后综合考虑人类心理认知习惯,构建了移动电子商务信任评价指标体系;在此基
表面肌电信号中连续动作信号的有效分段提取是对信号分析和处理的前提,提出了一种改进的肌电信号自动分割方法,为实现康复机器人信号全自动分析奠定了基础。该方法将表面肌电信
针对视频会议中存在的安全隐患问题及产生的原因,提出了在视频会议中使用多对一加密认证方案加密会话密钥的方法,该方法使用二次加密的方法保证了会话密钥的安全性,分析证明了该
分析了漫画构成文法,提出一种漫画结构定义法;分析了漫画帧排布特点和分治思想的关联性,提出基于二叉树结构的漫画帧迭代识别排序法;分析了漫画分割线特点,提出一种基于分割比的分割线选择算法。本方法可以对漫画帧进行自动识别、抽取与排序,帮助减少手动分割的工作量。分割后的漫画帧可以放在屏幕较小的手机或PDA上阅读,使漫画阅读方便、简单、生动。实验证明该方法对大多数漫画帧的识别分割和故事情节的先后顺序排列具有
在IDS的检测引擎模块设计中,基于Pattern-Matching的误用检测算法是设计师们最常用到的一种核心技术实现途径,而IDS丢包率和误报率的高低以及检测引擎匹配速度的快慢都取决于模
在以往电子投票方案中,验票工作都是由一名验票员承担,该验票员若不诚实,可能不记录合法选票,却统计不合法选票。为了解决该问题,提出了一种基于门限的电子投票方案。在该方
为了解决普通用户对于Web数据库的不精确查询问题,提出了一种基于语义相似度的Web数据库不精确查询方法。对于一个给定查询,该方法首先在查询历史中找出一个(或若干)与其相似度