基于语义特征空间上下文的短文本表示学习

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:xinxi_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本表示是自然语言处理中的基础任务,针对传统短文本表示高维稀疏问题,提出1种基于语义特征空间上下文的短文本表示学习方法。考虑到初始特征空间维度过高,通过计算词项间互信息与共现关系,得到初始相似度并对词项进行聚类,利用聚类中心表示降维后的语义特征空间。然后,在聚类后形成的簇上结合词项的上下文信息,设计3种相似度计算方法分别计算待表示文本中词项与特征空间中特征词的相似度,以形成文本映射矩阵对短文本进行表示学习。实验结果表明,所提出的方法能很好地反映短文本的语义信息,能对短文本进行合理而有效的表示学习。
其他文献
<诗经>是我国第一部诗歌总集,共收入自西周初年至春秋中叶大约500多年的民歌和朝庙乐章311篇,其中"小雅"有笙诗6篇,有目无诗,实际存数为305篇.
目的:观察中医药治疗阴痒的治疗效果。方法:200例阴痒患者,随机分为观察组和对照组,每组100例。对照组患者采用洁尔阴外洗治疗,观察组进行中医药治疗,采用阴瘁散熏洗,配合针对性的中
近几年在犬病诊疗中,发现有的病犬先出现后肢弛缓性麻痹,站立不起,继而前肢也相应地发生麻痹瘫痪。开始以风湿病、骨软症或佝偻病进行治疗无效,后结合临床症状的分析,认为与犬的急
文章以制度变迁理论为基础,从运行机制、正式与非正式制度等不同维度论述了在全民阅读政策执行过程中制度约束的影响,并提出建立多元化的全民阅读政策执行组织制度网络模式,
针对复杂网络中基于结构相似性的链路预测问题,在对比现有链路预测算法相似性指标的基础上,结合资源分配算法中节点资源共享概念和偏好连接算法中节点度与连边概率关系,同时
导弹在潜艇带速水下垂直发射出筒过程中涉及复杂的力学问题,弹体在出筒阶段受到适配器的约束,并受到其施加的横向支撑反力,使得出筒阶段弹体载荷水平较高。依据动量和动量矩定理
欧拉型藏羊是生长在青藏高原的肉用羊,具有独特的耐高寒低氧属性。本研究对1.0~1.5岁龄的欧拉型藏羊背最长肌的理化特性和近红外光谱特性进行分析,发现其蛋白质和肌内脂肪含量分别
房屋住宅建设是我国耗能大户,不但大量消耗钢材、水泥等建材,而且产生了巨量的碳排放。在欧、美、日等发达国家,房屋、住宅建设PC(工业化预制装配式)模式已推广数十年,这种住宅产业
随着医学模式由生物医学模式向生物-心理-社会医学模式的转变,随着我军飞机性能和装备跨越式的发展,对空勤人员航卫保障工作越来越显得重要。
本文介绍了过碳酰胺在农业、食品、水产养殖、医疗、纺织及其它方面的应用和合成方法。