基于时间递归序列模型的短文本语义简化

来源 :物联网技术 | 被引量 : 0次 | 上传用户:cx8105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统循环神经网络训练算法无法处理梯度消失和梯度爆炸等问题,基于循环神经网络建立LSTM模型和seq2seq模型,提出时间递归序列模型TRSM,处理序列中间隔和延迟相对较长的输入,使用BPTT反向传播算法对中文微博语料库进行训练。建立三组不同的实验作为对比,实验结果表明,TRSM模型处理后的微博文本更加简洁精炼,更适合文本语义的提取,大大减少了计算量,文字缩减率达到60%以上,语义保持率达到1.8,简化了用户要处理的大量信息,处理后的结果能够更好地用于几个关键中文语义的处理任务。
其他文献
朗诵的二度创作是对朗诵文本理解、感受、想象的基础上,通过一定的表达手段,把诉诸于视觉的文字符号变为诉诸于听觉的声音符号的过程。它既是对朗诵文本的展现和再延伸,也是
分析了环境空气的组成,环境空气的污染对人和动植物的危害以及对大气污染的防治。
太极拳是中华民族传统体育精华,它已成为高校体育课的教学内容。文章分析了中国高校太极拳教学的状况、作用,探讨了高校太极拳教学方法、考核模式,期望把握体育教学规律,提高
伐竹翁是《竹取物语》主人公之一。本文在揭示小说的日本竹文化背景基础上,通过考证伐竹翁所处的社会背景,探究日本竹编工艺文化,品味伐竹翁竹子般正直的品质,从一个方面揭示
日本的金竹文化鲜明体现在古代战争、传统节日、文学等方面,具有历史悠久、内涵深刻、表现广泛等特点。近代以后金竹文化低迷,但仍然是日本竹文化中最具神圣文化内涵的部分。
《 左传》 作为一部誉有“先秦叙事散文之最”的文学名著,其中不乏一些形态各异、丰富多样的女性人物.《 左传》 作者 对女性形象的刻画,无不本着“劝惩”的目的,或通过记述
GIS在国外逐步被应用于解决与空间分布相关的动物学、生态学和生物地理学问题[1, 2],目前,国内的研究尚不多见.子午沙鼠(Meriones meridianus)、长耳跳鼠(Euchoreutes naso)
通过普查1975-1982年逐日天气图资料,分别对塔里木盆地低值系统的位置、中心气压值、形状、等值线条数及天气性质进行了普查统计,得出了低值系统的一些特有特征.同时还讨论了
<正>日本现有竹林面积为14.13万hm2,有13个属,230种。在森林的周边生长着繁茂的竹林也是日本植物分布的最显著的特征。除北海道外,其他地区均有竹子生长,60%集中在九州。日本
<正>知与行是人类探知世界、反省自我、追问何去何从的一般命题,属于认识论、方法论和行为论的重要范畴。古今中外,上至庙堂下至乡野,无数人就知与行是否一体、孰先孰后等问