基于fastText模型的词向量表示改进算法

来源 :福州大学学报(自然科学版) | 被引量 : 0次 | 上传用户:waterkkk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次,针对fastText模型中n-gram分解格式进行限定,将分解条件设置为符合英文单词的组成结构;最后,去除fastText模型中单词前后缀标记符,减少无用分解对模型预测产生干扰.实验结果表明,与fastText模型相比,所提出的改进模型在单词关系评分、语义相似性、句
其他文献
未来战争模式逐步向智能化、多域化方向发展,装备体系对抗不断加剧,并呈现出智能化、体系化、无人化、平台化、战术化的特点,对传统体系对抗仿真技术提出巨大挑战,主要包括体
[摘 要:各大学校都非常重视教学质量和教学改革。本文提出了“经济学课程钟的双主体互动式教学模式”的理念、框架、优势和原则。并阐述建设经济学课程的双主体互动教学模式所涉及的核心知识模块、知识点和主要建设内容。  关键词:词经济学;“双主互动式”;教学模式]  一、引言  以“教师为中心”的课堂教学是目前教高职院校教学的主导形式,而这种“单向灌输式”的教学模式使得课程内容单向传递,学生们学习知识的主动
社会的进步与经济的增长推动了城市化建设的步伐,社会各界因而提高了对城乡规划的要求,尤其是对环境保护方面的要求。在此背景下,城乡规划设计逐渐融入了生态建筑设计。基于
本文以近几年来对大型油罐进行整治施工的现场管理实践为素材,从老式油罐的技术状况、整治设计和施工进展入手,对油罐整治中的四个技术环节:①罐底边缘板拆除及边缘板与部分
如今,计算机技术的发展大大提高了人类解决问题的能力,许多人类原来想都不敢想的复杂问题在计算机的帮助下得以逐步解决。无论哪个行业的从业者,几乎都需要借助计算机技术去
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
分析了当前民航航空电子系统理论和实践教学的发展趋势和现状,提出了基于虚拟仿真技术的机载电子系统教学素材库建设思路。系统仿真机载电子组件在不同外部环境和电源条件下
目的建立顶空(HS)气相色谱(GC)法测定生活饮用水中11种氯苯类化合物及六氯丁二烯的方法。方法取水样10 m L放入预先加入2.5 g氯化钠的20 m L顶空瓶中,在80℃平衡15 min后顶空
主要介绍DOS支持的个人计算机多相流分析和计算系统的功能,给出了实例并用不同的多相流模型进行分析,用流动图和三维压力曲面的比较研究了这些模型,讨论了一种新型模型,该模型试图克
目的:优化假性延髓麻痹穴位配伍方案,精简穴位,减轻患者痛苦。方法:用随机分组的方法将60例符合纳入标准的假性延髓麻痹患者分为治疗组和对照组,每组30例,分别进行针刺治疗,治疗结束