多媒体短文本分类

来源 :电脑迷 | 被引量 : 0次 | 上传用户:lovegyyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动终端的迅速发展,大量的社交软件如微博,微信,脸书等已经成为了人们生活中必不可少的社交软件.如果能精准的定位这些数据背后的人群,就可以产生极大的价值.与以往数据相比,当代数据主要有两点不同.第一,数据形式不同,传统的如bbs的社交平台都是基于纯文本形式,传统的数据分类方法主要是SVM,LDA等.现在的社交平台数据已经脱离的传统的纯文本形式,转换成图片+文本的多媒体文本形式,表现的最明显的就是在微博,微信中人们上传的信息.第二,在大数据时代,各种社交软件所产生的数据量与过去相比呈现指数型的增长.通过传统的方法很难收敛具有如此多维度的数据.
其他文献
《庄子》一书创作于先秦时期,代表着先秦时期说理散文的最高水平,这与其在叙事方面的成就是分不开的。本文将从《庄子》叙事荒诞的特色角度进行探讨,先对庄子荒诞的原因进行分析,由此探讨《庄子》人物形象的荒诞色彩、荒诞的叙事内容,语言风格的荒诞性,以及《庄子》叙事的荒诞特色对秦汉辞赋、小说、诗歌的影响等。本文共有六部分:第一部分为绪论,对选题的缘起进行了说明,对研究对象、方法进行了概述,还有对研究现状的几点
学位
当前,新媒体的快速发展对传统纸媒行业提出了更高要求,纸质媒体要应对新时代的挑战,就必须抓住机遇,勇于创新。本文通过分析我国传统纸媒目前面临的问题和困境,对比新媒体与
多媒体技术是利用计算机对文本、图形、图像、声音、动画、视频等多种信息综合处理、建立逻辑关系和人机交互作用的技术.真正的多媒体技术所涉及的对象是计算机技术的产物rn
期刊
建立了以离子液体和β-环糊精为添加剂的反向微乳毛细管电泳(MEEKC)法分离测定化妆品中丙酸氟替卡松、曲安奈德、醋酸可的松、地塞米松、氢化可的松和泼尼松6种激素的方法。
开展大学生创新创业教育是一项系统工程.随着大学生就业问题的日益凸显,开展创新创业教育有着重要意义.开展创新创业教育有利于提高就业质量,改善就业结构,以创业促就业.对大
体育教学实践证明,激发小学生主动参与运动的兴趣,是实施小学体育课程的主要内容教学和实现课程目标的有效手段与方法。只要唤起学生好动的意识,激发和保持学生的运动兴趣,就
2006年12月30日,中共湖南省委书记、省人大常委会主任张春贤视察湖南高院,并向全省法院广大干警表示新春慰问。他在通报了全省一年来的良好经济发展态势后认为,全省法院在各
2011年,国家发改委发布《关于开展碳排放权交易试点工作的通知》,确定北京、天津、上海、重庆、湖北、广东、深圳七个省市为碳排放权交易的试点省市,并拟定于2013年在试点省
介绍了Oracle公司提供的开发数据库应用程序的OO4O(Oracle Objects for OLE)技术,在Visual C++的环境下,利用OO4O调用PL/SQL,结合示例加以说明.