基于中心化相似度矩阵的词向量方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:nive123nive
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词向量使用低维稠密向量表示词,通过向量运算能够反映词间关系,被广泛应用于自然语言处理任务。对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性,两个数据集下词向量质量最高提升0.2896和0.1801。中心化能够提升降维前相似度矩阵质量,进而提升词向量质量。
其他文献
采用种子-半连续乳液聚合法,以硅烷偶联剂KH-560表面改性的单分散二氧化硅为改性材料,制得单分散疏水性SiO2改性的复合苯丙乳液。对乳液及涂膜性能进行了红外光谱、粒径分析
目的探讨两种根充材料治疗乳牙感染根管的临床疗效。方法整群选取2012年12月—2013年12月于该院行乳牙根管治疗的患儿共76例(136颗乳牙),将患儿分为两组,观察组38例(70颗乳牙
目前,社工为老服务在中原经济区发展中处于初步探索阶段,老龄化社会问题在城市社区尤为突出,老年人在退休后由社会走向家庭,大部分物质需求已经得到了满足,但角色的转变容易
目的:探讨兰索拉唑、阿莫西林、依卡倍特钠三联根除幽门螺杆菌(Hp)的有效性,旨在减少抗生素副作用、降低耐药性和抗生素不良反应发生率、提高患者依从性,并探讨其对细胞毒素相关
丹霞冶炼厂二段浸出前采用两台立式砂磨机进行开路磨矿作业,实际磨矿粒度仅达到-60μm占97%,与-17μm占97%的设计指标存在巨大的差距。浸出物料粒度粗延长了反应时间,严重影响冶
我国目前正面临着严峻的水体污染形势,在城市和近郊的河流与湖泊中,氮素污染尤为严重。由此而引起的水体黑臭、富营养化等现象严重影响了工农业的发展以及居民的日常生活。本
目的:研究新产程标准(New Labor Standards)实施,严格控制剖宫产后,首次剖宫产率primary cesarean delivery(CD)rates、剖宫产指征cesarean delivery indications及母儿预后m
目的研究分析小儿消化性溃疡的临床特点和治疗效果。方法选取2012年7月至2013年7月我院收治的消化性溃疡患儿120例,随机将其分为观察组(60例)与对照组(60例)。对照组患者给予
随着中国社会老龄化的加剧,养老问题越来越突出,中国社会原有的居家养老为主的养老模式越来越不适应社会经济发展的需要,随着社会的进步,老年人的养老需求也不再只限于吃饱穿
在社会主义新农村建设中,经济发展是首要任务,也是关键问题。新农村经济发展对于“三农”问题的解决和我国社会整体经济发展以及全面现代化的实现意义重大。本论文在我国社会