基于Word2fea模型的文本建模方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:shliukan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类在数据挖掘和机器学习中发挥着重要作用,该技术经过多年的发展,已产生了一系列的理论成果。传统向量空间模型的文本建模方法存在维度高、数据稀疏和缺乏语义信息等问题,然而仅仅引入词典的文本建模部分解决了语义问题却又受限于人工词典词量少、人工耗力大等多种问题。文中借鉴主题模型的思想,提出一种以word2vec算法得到词向量为基础,词聚类的类别为主题,结合文本中主题的频率、分布范围、位置因子等特征以获得文本在类别空间上的特征向量,完成文本建模的方法 word2fea。将其与两种文本建模方法 VSM和word2
其他文献
2018年11月16-18日,中国康复医学会将在北京国家会议中心举办2018第二届中国康复医学会综合学术年会暨国际康复设备展览会。本届年会以"聚焦新时代,引领新康复"为主题,设立国际
在应对公共卫生紧急状态时,面对诊断、治疗、预防等医疗用品的巨大需求,医药产品审批、监管机构需要应用已建立的加快药品审评审批机制,充分评估最新的形势,及时实施行之有效
探究药品监管证据规则,包括药品证据规则立法思维、内涵外延、证据实务三大构成。本文立足新《药品管理法》,结合我国食品药品证据规则立法历史背景,从取证实践出发,将药品证
中国社会科学院经济研究所所长张卓元日前发表谈话认为,目前国企改革明显滞后,收效甚微。其原因,一条是改革本身的难度大。如历史包袱重、社会负担多、传统体制惯性太强。另
化妆品定义《化妆品卫生监督条例》中化妆品定义是指以涂擦、喷洒或者其他类似的方法,散布于人体表面任何部位(皮肤、毛发、指甲、口唇等),以达到清洁、消除不良气味、护肤、
全国嵌入式系统学术会议(ESTC)是由中国计算机学会主办的嵌入式系统专委会年度学术会议,自2001年以来已经成功举办了十三届,已成为我国嵌入式系统及相关领域的专家、学者、工程师
[摘 要] 乡村治理作为国家治理的重要组成部分,直接关乎国家治理现代化建设。党的十九大报告提出要建立健全“自治、法治、德治”相结合的乡村治理体系,如何构建和完善“三治结合”的乡村治理机制成为现实而又迫切的任务。全面梳理七十年来我国乡村治理制度变迁历程表明,“三治结合”是政府主导的乡村治理制度变迁的逻辑必然和社会经济发展的客观要求。但是,构建“三治结合”乡村治理机制面临着自治、法治和德治等方面的诸多
随着观测气象资料种类的不断增加,传输时效要求增高,且传输流程越来越复杂,对气象信息传输也提出了更高的要求。但是目前气象信息的采集与传输还缺乏统一规划,且采集与传输平台分
全双工中继可以提高频谱利用率,但其存在的自反馈干扰信号影响了全双工系统的性能。目前大部分研究主要集中于单向全双工中继系统,对双向全双工中继系统的研究甚少。因此文中
本文简要介绍了国家强制性标准改革工作进展,对目前我国医疗器械强制性标准现状进行了调查分析,并在此基础上,根据深化标准化工作改革精神,对我国医疗器械强制性标准体系建设