一种基于聚类的文本迁移学习算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:mawenbo111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当现有训练数据过期,而新数据又非常少时,运用迁移学习能够有效提高分类器性能。本文提出一种基于聚类的文本迁移学习算法,给出了算法的主要思想及实现步骤。然后,在中文文本语料库上进行了实验,并与非迁移学习算法进行了比较。实验证明该方法能有效提高分类器性能。
其他文献
企业产品三维模型数据库的构建,是实现大规模定制设计和快速响应设计的基础。为了满足快速构建企业产品资源库的需求,提出了一种基于三维设计平台的企业零部件库参数化建模方
用图论的方法对最短路径问题进行数学描述,分析了单源最短路径Moore和Dijkstra两种算法对多处理机系统在图的搜索阶段的并行性差异;提出了Moore算法在多处理机系统中高效并行实
针对我国北方冬季供暖系统的特点及存在的不足,设计了基于嵌入式系统的ARM-Linux平台及模糊控制技术的室内智能温度控制系统。采用DS18B20及ZigBee无线组网技术完成了多点温
日前,全球首条600 k A铝电解槽在山东魏桥铝电有限公司通过了近十位行业顶级专家的审评.专家组一致认为,"NEUI600 k A级铝电解槽技术开发和产业化应用"项目有力地推动了铝行业
随着数据的大量增加,数据之间的结构异构和语义异构成为数据集成的重点与难点。本文利用Ontology语义集成上的优点,提出了一种基于Ontology的异构数据库的语义集成框架,并提出采
提出一种在Web上自动构造电子课本学习系统的方法。学习者通过遍历域本体库的本体概念图,指定主题层次。引导主题爬取Web文档,自动构造电子课本,在Web上学习就像在读一本书。
目前很多的Web应用程序为了提高用户体验都包含大量动态内容,从而给Web应用程序带来了安全隐患。而跨站脚本攻击(XSS)是目前安全漏洞中排在前列并引起广泛注意的安全隐患之一。
抑制应变片图像采集和传输过程中的噪声,是实现应变片识别和精确安装的关键技术,针对形态学去噪时会导致图像细节模糊的特性,本文引入模糊形态学,根据隶属度来对图像进行划分,将分类的图像像素值分别进行对应的模糊形态学操作,然后在此基础上再对整幅图像进行模糊形态学的开闭平滑来实现对图像的去噪滤波。仿真实验证明该方法可以有效的去除噪声,而且不会对图像的边缘细节造成模糊。
为了克服Weka系统在聚类算法方面的不足,在Weka的开源环境下进行了二次开发,扩充了聚类算法。介绍了Chameleon算法的基本原理和构建步骤,给出算法的具体描述,并将Chameleon算法嵌
代码迷惑是一种以增加理解难度为目的的代码变换技术,主要来保护软件免遭逆向分析。恶意代码的作者为了躲避检测经常采用代码迷惑技术对程序进行转换。但是商用反病毒软件采用