基于认证用户信息的微博用户类型识别方法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:shibin19860211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博用户可以分为个人用户和非个人用户两种类型。在微博中对这两种用户类型进行自动分类是智能广告、用户个性分析等应用的一项基本任务。针对该任务,提出了一种基于机器学习的自动分类方法。该方法的特色在于,不需要人工标注样本,而是利用微博中认证用户类型的语料作为训练样本构建分类器,用于对非认证用户类型进行分类。具体实现中,将用户名和用户发表的微博文本作为表示用户的样本,使用基于最大熵算法进行用户分类。实验表明这种利用认证用户对非认证用户进行类型分类的方法能够获得较好的效果。
其他文献
墨家逻辑作为产生于中国先秦时代的重要的逻辑体系,它与西方逻辑一样研究了推理论证及其正确性问题,但墨家逻辑的研究更偏重概念间的内涵关系,同时墨家在推理和论证中表现出
结合太原南站中的桥梁工程实例,对桥梁工程在钻孔桩、墩台、墩柱及现浇梁施工中的安全措施及方案编制进行了详细分析,以期为桥梁施工的安全管理提供一定的参考借鉴。
用串口通信实现PC与单片机系统的数据通信,使PC控制PWM波的占空比和电机的方向信号,然后通过L298N驱动电路控制直流电机的转速及转向。用vspdxp的虚拟串口与Proteus对整个系
近几年,江西省大力实施“农村义务教育薄弱学校改造项目”、“农村义务教育学校标准化建设工程”、“全面改善贫困地区义务教育薄弱学校基本办学条件项目”等工程,让广大农村学
<正>本刊讯:江西省井冈山市龙市小学承办的"互联网+红色传承"革命传统教育主题活动,日前在井冈山举行。龙市小学充分挖掘得天独厚的革命历史资源,利用红色资源和互联网平台,
在工作部署上,要坚持扩大内需与增加出口和提升产业、企业、产品竞争力与提高环境竞争力两个并重。记者:刚才您说。在2002年形势的把握上,要正确认识世界经济明显放缓和我国
笔者以历史为线索,对美国硕士生教育的历史作了完整而系统的研究,通过对硕士生教育四个发展阶段的研究,展示美国硕士生教育的历史发展,现实特点及其未来挑战。
综述电力机车现有的涂装体系用漆状况;分析涂装用料与施工工艺的关系以及对环境的影响,指出在今后的10年里电力机车涂装用漆仍是溶剂型涂料占主导地位,但高固体分涂料和高装饰性涂
一项新研究表明,地中海饮食的确有益健康。食用高脂鱼类、坚果、全谷物、水果、蔬菜一甚至不时来一两杯葡萄酒一可使在未来十年内罹患心脏病的风险降低近一半。希腊哈罗科皮翁
在学科中渗透心理健康教育是培养合格人才的时代需要,学科教材蕴藏丰富的心理课程教育资源。在课堂教学中如何进行心理健康教育,是每位教师应该思考也应解决好的重要问题。这