【摘 要】
:
社交网络平台产生海量的短文本数据流,具有快速、海量、概念漂移、文本长度短小、类标签大量缺失等特点.为此,文中提出基于向量表示和标签传播的半监督短文本数据流分类算法,可对
【机 构】
:
合肥工业大学计算机与信息学院,合肥工业大学工业安全与应急技术安徽省重点实验室
【基金项目】
:
国家重点研发计划项目(No.2016YFC0801406);国家自然科学基金项目(No.61503112,61673152)资助~~
论文部分内容阅读
社交网络平台产生海量的短文本数据流,具有快速、海量、概念漂移、文本长度短小、类标签大量缺失等特点.为此,文中提出基于向量表示和标签传播的半监督短文本数据流分类算法,可对仅含少量有标记数据的数据集进行有效分类.同时,为了适应概念漂移,提出基于聚类簇的概念漂移检测算法.在实际短文本数据流上的实验表明,相比半监督分类算法和半监督数据流分类算法,文中算法不仅提高分类精度和宏平均,还能快速适应数据流中的概念漂移.
其他文献
针对油气在管道运输过程中会产生聚合物、油垢、沉结物等污垢附着在管道壁上,严重影响运输管道的油气质量和运行安全。结合现代人工智能和智能制造技术,提出采用一种移动式机
2012年,民政部等6部门联合发布了《边远贫困地区、边疆民族地区和革命老区人才支持计划社会工作专业人才专项实施方案》,该方案提出从2012年起至2020年,每年引导10万名优秀社
目的分析预见性护理在血液透析患者护理安全中的应用效果。方法选取某医院2015年12月~2017年12月间收治50例血液透析患者进行实验研究,采用随机数字法将患者分为实验组和对照
天然气的广泛利用对于提高能源利用效率,缓解能源运输压力,减少污染物排放,改善大气环境,提高人民生活质量具有重要的作用。天然气中人为加入微量强刺激性气体以警示天然气的
大学生宿舍,一般有8—10人,是高校中最小的群体,却是大学生在校学习、工作、生活逗留时间最长的主要场所。研究表明:大学生一天24小时,其中课堂环节占3.9小时,宿舍环节占5.8
针对目前快递纸箱普遍依赖人工包装导致效率低的问题,设计了新型快递纸箱合页机构。采用阶梯轴结构和步进电机,实现合页机构的驱动功能;采用凸轮和连杆机构,设计了合页机构的
目前,我国农村学前教育发展的主要问题有:缺少专业幼儿教师,幼儿教师的工资低,教学环境和条件差,农村的幼儿园数量很少、但农村幼儿数量多,导致每个班的学生很多,不符合教育
目的调查乳腺癌患者对灵性照护的需求水平及其影响因素。方法采用自行编制的一般资料问卷和中文版灵性护理需求量表对151名乳腺癌患者进行问卷调查。结果乳腺癌患者对灵性照
在大型装备制造业中,通常采用分段制造、整体拼装的工艺流程。为了保证装配精度,需要使用动态坐标测量技术实时监控装配过程,提供全姿态信息。室内坐标定位测量系统(wMPS)是
北京东郊农场厂务公开总体思路是“四三二一”: “四”是指:厂务公开的内容要围绕四个方面进行。即:1.围绕企业的改革、改组、改制方面。2.围绕职工下岗分流、劳动合同续签