基于word2vec结合TFIDF的词类扩充应用研究

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:aerostock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旨在解决在词类标注样本稀缺的环境下,通过某种算法来给词类进行关键词扩充,应用场景是互联网社交平台需要根据话题组即词类,进行广告推送,而词类扩充相关词能达到广告推送量大,而且精准的效果。实验中前后使用了两种算法进行研究,一种是类似于Google的Page rank找到相关词进行扩充,这是运用比较广泛的算法;另一种是提出的与结合TFIDF的word2vec计算词间相关性的算法。给出了对比数据,word2vec能较好地实现词类扩充的需求。
其他文献
本文通过运用问卷调查法、文献资料法、访谈法和统计法等研究方法,对四川省水上运动学校赛艇运动员常见运动损伤原因进行研究。研究发现:赛艇运动员在一年内都有损伤,容易损伤
<正> 楼兰是西域三十六国之一,分布在罗布泊附近,在中国历史上赫赫有名。楼兰故城是古楼兰国最重要的历史遗迹。城址在两条古河道的中间,略成正方形,边长330米左右,占地10多
期刊
为了使小学母语教学质量有质的飞跃,采用斯金纳强化理论进行分析,以达到提高低年级学生习得母语水平的效果。
华人计算机教育应用方面的研究方兴未艾,总结过去的经验教训,展望未来,如何使这方面的研究更有效地对正式和非正式的学习实践产生积极影响?作为华人计算机教育应用的研究者,我们需
随着"龙江丝路带"建设的不断推进,黑龙江省依托地缘优势,积极拓展与周边国家的合作,特别是同俄罗斯的合作。为了切实有效地推动龙江地区对俄合作的深度和广度,目前迫切需要大批
目的:观察激素联合不同免疫抑制剂治疗高危因素特发性膜性肾病(IMN)的临床疗效。方法:选取收治的IMN患者90例,随机分成A组(甲基泼尼松龙+环磷酰胺)、B组(甲基泼尼松龙+霉酚酸酯)和C组(甲
吴镇在画史上成就斐然,他还是一位文学家,他的作品多以题画诗的形式出现,而以《渔父词》为多,值得从纯文学的视角进行解读,吴镇是位"隐不绝俗"的"隐士",酒与画陪伴他,给我们
新医改方案的出台,对改进医疗机构的内部管理提出具体的要求,包括:优化服务流程,规范诊疗行为,明显缩短病人等侯时间等等。各级医疗机构先后推出符合现代生活方式的就医便民服务,进
加强城市社区工作者队伍职业化、专业化建设是加强新时代社区治理、适应长春市社区工作转型升级的迫切要求。当前,随着社区治理创新的深入发展,社区工作者队伍职业化、专业化
传统的中国皮影艺术,有着悠久的历史和辉煌的成就。尽管如此,从20世纪80年代至今,逐渐被人们淡忘。通过对皮影艺术形式地深入研究,对当代国内外多媒体技术应用形式的广泛分析。阐