文本自动分类新探究

来源 :赤峰学院学报:自然科学版 | 被引量 : 0次 | 上传用户:uspjxt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类是一种有效的组织信息和管理信息的工具.传统分类方法一般在分类效果和运行效率两者上不可兼得.通过综合Rocchio和KNN两种分类方法的优点,设计了一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好解决不平衡类问题,实验结果显示该方法能达到与SVM相当的分类效果.
其他文献
共价有机框架化合物(COFs)是一种具有多孔结构的结晶型有机聚合物材料,它是由C、H、O、N、B等轻元素通过共价键连接而成。由于其具有好的热稳定性和化学稳定性、大的比表面积
为消除地形复杂地区不同地物的同谱异物现象,在遥感(RS)和地理信息系统(GIS)技术的支持下,采用分区分类方法对宁夏银川市1991和1999年的Landsat TM/ETM+影像进行解译,得到了银川市两期土地利用/覆被变化数据。在此基础上,通过转移矩阵和土地利用/覆被变化幅度、动态度及状态指数模型,对银川市土地利用/覆被变化的状况和变化过程进行了研究。结果表明,在研究期内,银川市各土地利用/覆被变
针对自主车辆的机动目标跟踪问题提出了一个利用雷达和图像传感器的融合跟踪方法.采用动力学模型对车辆运动进行描述以适应车辆机动的情形.利用雷达的距离信息建立视觉窗口,
双塔结构作为一种新兴的建筑结构被广泛的应用于高层建筑结构中,由于其本身结构复杂的特点,按传统的分析方法和模型进行自振特性分析显然不能准确的反映结构的特性,因而对高层建
2006年1月9日上午,全国科学技术大会在人民大会堂隆重开幕。此次大会上,中国科学院新疆生态与地理研究陈亚宁研究员主持的国家“十五”攻关课题成果“克拉玛依地区新绿洲建设综
阐述了混凝土结构设计考虑安全度的重要意义和必要性。通过对比《混凝土结构设计规范》GB50010-2002与《混凝土结构设计规范》GBJ10-89在安全度的差异,探讨我国现行混凝土结构
针对某难浸氧化金矿石的矿石性质,采用硝酸预浸技术进行提金试验研究。其结果表明:在最佳试验条件下,可获得金浸出率87.86%、银浸出率76.56%的较好指标。相对于其他处理工艺,