GPU通用计算在文本分类中的应用研究

被引量 : 0次 | 上传用户:hdazf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,人们日益普遍地使用计算机来生产、处理、交换和传播各种形式的信息,世界对信息的需求快速增长,而文本是承载信息的主要载体,文本分类技术也越来越受到人们的关注。文本分类问题是将一篇未知类别的文档归入预先定义的类别中,而文本的自动分类则是使用计算机来实现这样的分类。文本分类可以更好的帮助人们组织文本、挖掘文本信息,文本分类技术也成为信息处理领域最重要的研究方向之一。虽然人们对文本分类算法做了大量研究和发展,但是分类速度和分类精度依然是一对矛盾,文本分类算法的时间复杂度依然很大,在现有的串行结构下,很难有质的突破。因此,本文针对文本分类中遇到的现实问题,在不降低分类准确度的情况下,将传统文本分类算法在GPU上并行实现,利用GPU强大处理能力和高带宽减少文本的训练时间。近年来GPU已经在科学研究和超级计算领域取得突破性进展,随着数百万支持CUDA的GPU已经遍布全球计算机,研究人员正在将CUDA应用到更广阔的领域中。本文对文本分类相关技术和CUDA编程模型作了深入研究,首先介绍了文本分类相关技术和理论,研究了现行分类算法的缺点和不足,然后对GPU通用计算和CUDA编程及程序优化进行了研究。本文根据KNN算法的特点提出了一种基于GPU的并行KNN算法,主要包括并行的相似度算法和排序算法,并对CUDA程序作了优化。最后将本文的算法在GPU上实现,对实验结果进行了分析,结果显示基于GPU的并行算法有很高的加速比,证明了GPU并行计算加速文本分类算法的有效性。
其他文献
铁是植物正常生命活动过程中的必需微量元素之一。由于土壤中铁的有效性很低,导致植物极易缺铁,不仅影响作物的产量和品质,而且影响人类微量元素健康,因此如何通过生物强化达
为了充分突出产品的个性化要求,对产品设计以及结构、性能进行不断的优化后,大大提高了熔模铸造工艺的难度,如果不能很好的解决组树、制壳、涂挂、撒砂、风干、清砂、铸件清
SPOCs为小规模限制性在线课程,是MOOC教学方法演变的一种新形式,其主要核心是翻转课堂教学,重新调整课堂内外的时间,将学习的决定权从教师转移给学生。借鉴台湾经验,高职院校
目的观察切断前交叉韧带(ACLT)构建SD大鼠骨性关节炎(OA)模型的病理特点,并检测miR-146a和miR-27a在OA动物模型软骨、滑膜组织中的表达情况。方法120只SD大鼠随机分为实验组
从梳理和界定个人金融产品的基本概念入手,从不同角度描述与分析了个人金融产品的特性及其所揭示的市场营销含义,并以此为基础,对我国金融机构开展个人金融业务过程中的缺陷
<正>直线与圆锥曲线的位置关系是平面解析几何的重点内容,也是高考重点考查的内容之一.该类题型难度较大,相对具有一定的综合性,涉及知识面较多,运算量大,题型灵活多变等特点
2004年至今,在国家支农政策的推动下,农业种植结构大幅度调整,粮食产量连续增加,而且启动了全国测土配方施肥项目。采用2008年的农户调研数据与2001年进行对比,揭示了我国粮
转基因作物诞生以后已经获得了很快的发展,随着转基因作物商业化进程的加快,转基因作物的食用安全和环境安全问题越来越得到重视。为了对转基因作物的流通进行规范管理,各个
目的探讨EBV、HCV与贵州地区NHL的相关性。方法ISH方法检测180例NHL中EB病毒编码的小核苷酸EBER1/2,采用原位RT-PCR法检测58例NHL中HCVRNA。IHC方法检测EBV潜伏膜蛋白LMP-1。
重症急性胰腺炎(SAP)伴有全身炎症反应综合征,可致多系统器官功能障碍,预后凶险。目前认为SAP的发病与体内促抗炎机制紊乱密切相关,此过程中细胞因子和炎症介质过度释放以及