基于发现特征子空间模型的文本分类算法

来源 :计算机应用研究 | 被引量 : 3次 | 上传用户:shushuclover1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在非结构化数据挖掘结构模型,即发现特征子空间模型(DFSSM)的运行机制下,提出了一种新的文本分类算法——基于DFSSM的文本分类(TCDFSSM)算法。该算法在文本训练及分类阶段的基础上增加了自动反馈阶段,使得TCDFSSM具有自学习能力,并给出了文本分类过程反馈阈值的选取算法。结果表明,该算法分类效果良好,其自学习能力、适应性及鲁棒性更加优越。
其他文献
在概率Applied Pi下对安全协议的匿名度进行研究:它在概率Applied Pi进程上定义了metric,以对进程间的相似进行度量;该定义被证明是有效的,因为当两个进程之间的metric为0时这两个进程弱互模拟;基于metric给出了匿名度的形式化定义。最后分析了密码学家就餐问题,用概率Applied Pi对其建模,计算匿名度。
本文研究拟合假设的直径分布正如威布尔分布一样,是根据水平样点的直径分布而来的。人们对极大似然法和目前的距法这二种方法进行了初步讨论,其结果使用于经级预估生长和收获
分析宣威市农村能源消耗结构及能源需求状况,阐述发展薪炭林的可行性和必要性,提出科学规划、合理布局,完善机制,增加资金和技术投入等发展薪炭林的对策建议。
流体壁面剪应力的标定是实现该类传感器测量的前提。本文介绍了目前主要的3种壁面剪应力静态标定方法和2种动态标定方法,研究了剪应力基准发生原理、标定装置组成及适用范围。归纳总结了各类标定方法的优势与缺点,为壁面剪应力传感器标定方法的合理选择提供参考。
为发展高超声速边界层转捩的试验研究手段,在中国空气动力研究与发展中心(CARDC)超高速空气动力研究所的FDG14激波风洞上开展了基于纹影显示技术的边界层转捩特性研究.试验模
采用专门研制的小型动态测力天平,通过弹簧悬挂节段模型内置天平同步测力测振风洞试验,对3:2矩形断面的非线性驰振自激力进行了测量.比较了基于实测自激力重构的节段模型位移
利用一种新的核方法即核最近邻算法预测蛋白质相互作用,算法新颖、简洁,容易实现。实验结果表明,核最近邻算法的预测效果优于传统的最近邻算法及其他已有的预测方法,可以作为蛋白质相互作用预测的一个有效工具。
SOA与EDA架构的整合应用是未来企业实时软件架构的主流趋势,但要充分发挥两种架构的互补综效,就需要有好的事件管理机制及提供服务的配套设计。针对目前企业应用系统开发面临的主要问题,运用事件价值观分析事件所提供的价值对用户的重要性与实际贡献,设计一种价值驱动的智能化事件本体模型,有效结合了SOA整合系统与EDA即时通知事件的功能,为设计具有弹性、效率与应变能力的健全的企业级系统架构提供了新的解决方案
迭代最优化算法是模式识别中重要的无指导学习方法。算法因随机确定k个聚类中心进行初始划分的原因,存在初始聚类中心选择的盲目性、容易陷入局部极值、忽略样本的聚类趋势等缺点。经过对迭代最优化算法的研究与分析,根据样本的聚类趋势,结合邻域思想,改进了聚类中心的选择方法,设计了基于样本邻域概念的迭代最优化算法,算法总的时间代价为O(n)。该算法已应用于基于SNMP协议的网络故障管理中的故障分析,分析结果与实