【摘 要】
:
针对微博关键词抽取准确率不高的问题,提出一种基于标签优先的抽取排序方法。该方法利用微博本身具有的社交特征——标签,从微博内容集中抽取关键词。该方法首先根据微博自身
【基金项目】
:
国家社会科学基金资助项目(15BGL048);国家863计划项目(2015BAA072)~~
论文部分内容阅读
针对微博关键词抽取准确率不高的问题,提出一种基于标签优先的抽取排序方法。该方法利用微博本身具有的社交特征——标签,从微博内容集中抽取关键词。该方法首先根据微博自身建立初始词与微博之间的加权图,再将基于标签的随机游走方法应用于图中,随机游走反复跳跃到标签词节点上,经过一系列迭代得出每个词的平稳概率,并通过概率决定词的最终排序。该抽取方法根据真实的新浪微博内容进行测验,结果显示,与通过词与词的加权图来抽取关键词相比,基于标签的微博关键词抽取方法准确率提高了50%,在实际应用中能够有效提高关键词抽取的正确率。
其他文献
现在,越来越多的人关注维生素D及钙与心血管疾病(CVD)的关系。上世纪,大多数学者们认为维生素D及钙是引发CVD的病因。本世纪初,人们对维生素D及钙有了更进一步的认识。本综述主要
为了提高带有口音的说话人的语音识别的准确率,提出一种有向无环图-深度置信网络多口音分类的方法.通过提取说话人的梅尔频率倒谱系数及其一阶、二阶差分特征,获取语音参数的
新媒体终端设备已成为大学生的重要学习工具,传统授课方式已不能适应时代发展,学生对思政类教育资源需求增加,对高职院校思想政治教育的教学资源、教学环境、教学主客体、教学手
针对微博聚类正确率不高的问题,在研究微博数据特点的基础上,利用微博hashtag来增强向量空间模型,使用微博之间的转发关系提升聚类的准确性,并利用微博的转发、评论数以及微
基于农村土地流转的意义,以河南省方城县为研究对象,从农村劳动力素质偏低、现有农村土地承包的分配模式不利、土地流转缺乏市场机制、土地流转程序不规范、农村缺少社会保障
随着信息时代与知识经济的发展,人力资源管理面临越来越多新的挑战与机遇,也因此而产生了许多创新。本文立足于信息技术的应用、知识型员工的管理与开发,回顾和总结了当前人
目的分析鼻出血的原因,总结鼻出血的治疗方法,探讨各种治疗措施在处理鼻出血中的意义。方法对近5年来住院治疗的鼻出血患者800例进行回顾性分析与研究。结果 800例均治愈,治
数控行业的空前发展,使数控铣刀样式繁多,对其进行合理划分和对其应用条件和场合的分析是很有实际意义的。
The unprecedented development of the numerical control indus
为了提高对黔西南州重霜冻灾害的认识,做好黔西南州冬季农作物防御低温冻害工作,利用气象资料,对2009年3月13-14日黔西南州出现的严重低温霜冻灾害进行了分析研究。结果表明,受灾
探讨关联翻译理论视角下汉语歇后语的翻译方法,应采取直接翻译与间接翻译相统一的模式,以达到原文作者的交际意图与译文读者的认知期待的最佳关联,保证歇后语翻译的信度和效度。