基于局部特征选择的微博中文文本分类研究

来源 :现代计算机:中旬刊 | 被引量 : 0次 | 上传用户:gy19890509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证;由于微博短文本维度高存在严重的特征稀疏问题,全局特征选择算法容易忽略对某个类别重要但对语料集关联度小的特征,并采用局部特征选择方案。实验结果证明局部特征选择方法可以获得更高的分类效果。
其他文献
SIFT算法对发生旋转、平移、仿射变换后的图像匹配具有很好的效果,同时具有较强的稳定性和鲁棒性。由于快速EMD距离相比欧氏距离在计算特征直方图匹配时更加准确,提出结合快速EMD距离与SIFT的人脸识别算法,改进原有算法的匹配策略,使用快速EMD距离代替欧氏距离计算特征点间的相似性。在YALE人脸库上的实验表明,改进的人脸识别算法比原有算法具有更高的识别率并且对人脸图像的旋转、遮挡、一定程度的仿射变
近日,来自海内外的数百家参展商与近10万名投资者参加了由中国连锁经营协会主办的第三届中国特许加盟展览会暨特许加盟大会.
期刊
大学总是想方设法从校友身上募集资金,但总有校友会提供一些"另类"的捐赠,以下是世界上一些名校收到的不同寻常的礼物。1.卫生间(美国科罗拉多大学)以个人名义捐赠一个学院、
科学家研究发现,每过1000年,人类的脸就会缩小2%左右,我们祖先的头和脸都比我们大30%。美国俄亥俄州大学人类学家拉森教授在世界各地收集了数以千计的牙齿、腭骨、头骨。经过仔细比较发现人类的脸存在渐渐变小的趋势。他表示,这种趋势大约开始于1万年前。原始人跟现代人比较,不仅身体强健,脸型也更加粗犷。  从肢体上来讲,今天的人类已经没有办法跟古人比较了,无论是抵抗能力,还是爆发力。甚至于这样的变化也给
1962年肖恩·康纳利向全球的影迷宣布:"我叫邦德--詹姆斯·邦德."在21年间的七部邦德影片中,这位高大、黝黑的苏格兰人表现出的温文尔雅的特工形象,使全世界对他的代
期刊
运用形式化方法分析密码协议的安全性已成为网络信息安全领域的研究热点之一。提出一种新的扩展Petri网——LPetri网。并且利用LPetri网对TMN密码协议进行建模,采用模型检测
在遥感影像的处理过程中,针对遥感影像各瓦片数据生成的快视图之间存在色差的问题,通过对整景影像数据和各瓦片数据进行分析,在采用2%线性拉伸算法进行影像处理的基础上进行改进,提出使用共享直方图信息的策略来进行快视图的生产,即用整景影像的直方图信息代替各瓦片直方图信息来决定各瓦片应去除的像素点,然后再对瓦片剩余像素点的灰度值进行线性拉伸,以此来达到减小各快视图之间色差的目的。
将视频监控技术应用于规模化养猪场能大大减少人力,提高效率。猪只行为分类是通过图像处理计数从视频中获得猪只信息后的图像信息分析阶段,如何从大量数据中挖掘出猪只的行为
一日和爱人上街,碰到一个卖小包包的摊子,生意特好.爱人也挤进去,吵着要花8元买一个巴掌大的小包.我说服不了她,只好"破费".待我细看,这小包质量不错,而且容得下一面小镜子、
期刊
近期,国内“稻强米弱”的格局并未得到改善。临储稻谷拍卖成交率偏低,对市场影响不大,粳籼稻谷价格维持平稳,与此同时,大米消费需求总体偏弱,加工企业生产积极性不高。