【摘 要】
:
自动词语简化是用简单、同等意义的词语替代句子中复杂词的过程,是文本简化中的一个重要研究方向.随着自然语言处理技术的快速发展,词语简化方法也在不断更新与变化.该文对词语简化方法的相关研究进行了梳理,先对词语简化的整体框架进行解释,然后将词语简化方法总结为语言数据库、自动规则、词嵌入模型、混合模型和预处理语言模型.接着对汉语词语简化研究所面临的难点进行论述.最后,对词语简化方法的发展方向进行了展望和总结.
【机 构】
:
扬州大学计算机科学与技术系,江苏扬州225127;大数据知识工程教育部重点实验室(合肥工业大学),安徽合肥230009;合肥工业大学大知识科学研究院,安徽合肥230009
论文部分内容阅读
自动词语简化是用简单、同等意义的词语替代句子中复杂词的过程,是文本简化中的一个重要研究方向.随着自然语言处理技术的快速发展,词语简化方法也在不断更新与变化.该文对词语简化方法的相关研究进行了梳理,先对词语简化的整体框架进行解释,然后将词语简化方法总结为语言数据库、自动规则、词嵌入模型、混合模型和预处理语言模型.接着对汉语词语简化研究所面临的难点进行论述.最后,对词语简化方法的发展方向进行了展望和总结.
其他文献
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题.首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到 目标汉字的形似字候选集.实验结果表明,该文所提出的方法对于不同结构汉字的字形相似度计算有一定效果,所形成的汉字部件组成库,为之后字形计算的相关研究提供了行之有效的数据集.同时,也拓宽了 日语等类汉语语言文字字体相似度计算的研究思路
本试验旨在揭示桑叶多糖(MLP)对免疫抑制小鼠肠道损伤和微生物多样性的调节作用,初步阐明其作用机制.选择体重(20.0±0.5)g的5周龄雄性BALB/c小鼠60只,随机分为正常对照组(NC组)、环磷酰胺模型组(MC组)、桑叶多糖低剂量组(MLPL组)、桑叶多糖中剂量组(MLPM组)、桑叶多糖高剂量组(MLPH组)和药物对照组(LM组),每组10只小鼠.各组小鼠腹腔注射80 mg/kg BW环磷酰胺(除NC组外),每天1次,连续3 d,以诱导免疫抑制.第4天开始MLPL、MLPM、MLPH和LM组小鼠每天
本试验旨在探讨百里香酚与迷迭香酸组合对脂多糖(LPS)攻毒大鼠生长性能、炎症反应和肠道健康的影响,为百里香酚与迷迭香酸组合在动物生产方面的开发和应用提供参考.试验选取40只21日龄SD大鼠,随机分为4组,分别为对照组(Con组)、百里香酚组(Thy组)、迷迭香酸组(Ros?A组)、百里香酚×迷迭香酸组(Thy×Ros?A组),每组10只(公母各占1/2).Thy组、Ros?A组和Thy×Ros?A组每天分别按照20 mg/kg BW百里香酚、20 mg/kg BW迷迭香酸、10 mg/kg BW百里香酚+
本试验旨在以小鼠为模型探究摄食节律在高脂饲粮(HFD)诱导的代谢综合征(MS)中的作用.将健康的雄性小鼠分为4组,每组5只,连续3个月分别给予含4%脂肪的普通饲粮(Con组)和含10%(10%HFD组)、45%(45%HFD组)、60%(60%HFD组)脂肪的HFD,每周记录小鼠体重,收集血清、肝脏等标本检测生物标志物.为了进一步探究HFD对摄食节律的作用,将另一批小鼠分为Con组与45%HFD组,第1周2组小鼠均饲喂普通饲粮,第2周和第3周Con组继续饲喂普通饲粮,HFD组则饲喂含45%脂肪的HFD,每
话题分割是自然语言处理领域的经典任务之一,其目标是将输入的篇章分割成语义连续的段落.先前的工作使用基于词频、隐式、序列以及Transformer的方法来编码句子,忽略了对篇章整体语义信息的建模.因此,该文采用篇章结构图网络编码句子,获得具有篇章全局信息的句子表示用于话题分割.具体地,该模型首先为每一个篇章单独建图,其中包含篇章的所有句子和单词节点以及它们之间的邻接信息.然后,模型使用门控图神经网络对图进行迭代,得到包含篇章全局信息的句子表示.它们被进一步送入Bi-LSTM层以预测话题分割点.实验结果表明,
前沿相关研究将相似问句识别转化为二元问句匹配识别并取得很大进展.但是在自动问答系统的实际应用场景中存在大量数据,这些方法受限于二元问句匹配识别模式,导致时效性不高.针对这一问题,受人脸识别相关研究的启发,该文提出基于语义空间距离衡量的相似问句识别方法(Semantic Space Distance Method,SSDM).该方法将相似问句识别作为多分类问题进行训练,通过利用人脸识别任务中Margin Softmax损失函数得到语义编码模型.该语义编码模型能够将相似问句在语义空间中聚合,不相似问句在语义空
城市地下综合管廊包括电力、通信、燃气、供热、给排水等各种基础功能的城市工程管线.工程本身具有统一规划、统一设计、统一建设和统一管理的特征,随着互联网技术与通信技术的发展,城市管廊施工中开始体现出对BIM技术的应用,也为5G技术在其中的应用提供了多种可能.文章指出5G技术在BIM+城市管廊施工中最突出的价值表现为能够大幅提高各类数据的实时传输效率,突破管理工作在时空条件上面临的局限,提升工程管控效率,还能为工程提供实时且精确的工程数据.
本试验旨在研究硼对大鼠肝脏显微结构、肝糖原含量、抗氧化功能及细胞增殖和凋亡相关基因表达的影响.选用100只清洁级健康的(22±2)日龄雄性SD大鼠,适应性7 d后随机分为10组,每组10只.对照组饮用蒸馏水(硼含量为0),试验组分别饮用硼含量为5、10、20、40、80、160、320、480、640 mg/L的蒸馏水.试验期60 d.结果表明:1)与对照组相比,饮水补充5、10和20 mg/L硼可明显改善肝脏显微结构,肝小叶轮廓更加清晰,肝细胞索排列更加整齐,双核肝细胞数量增多,肝枯否氏细胞数量增加,进
汉越神经机器翻译是典型的低资源翻译任务,由于缺少大规模的平行语料,可能导致模型对双语句法差异学习不充分,翻译效果不佳.句法的依存关系对译文生成有一定的指导和约束作用,因此,该文提出一种基于依存图网络的汉越神经机器翻译方法.该方法利用依存句法关系构建依存图网络并融入神经机器翻译模型中,在Transformer模型框架下,引入一个图编码器,对源语言的依存结构图进行向量化编码,利用多头注意力机制,将向量化的依存图结构编码融入到序列编码中,在解码时利用该结构编码和序列编码一起指导模型解码生成译文.实验结果表明,在
本试验旨在研究饲粮中添加维生素E和酵母硒对肉兔生长性能、屠宰性能、肌肉品质和抗氧化性能的影响,为生产高档功能性兔肉提供理论参考.选用35日龄、体重相近的断奶闽西南黑兔160只,随机分为4组,每组10个重复,每个重复4只.Ⅰ组(对照组)饲喂基础饲粮,不额外添加维生素E和酵母硒;Ⅱ、Ⅲ和Ⅳ组分别在基础饲粮中添加100 mg/kg维生素E、0.15 mg/kg硒和100 mg/kg维生素E+0.15 mg/kg硒.预试期5 d,正试期70 d.结果表明:1)饲粮中添加维生素E和酵母硒对肉兔生长性能和屠宰性能均无