无指导学习相关论文
文本提出一个多策略的词义排歧知识的学习模型和排歧方法,并实现了一个采用无指导学习方法的文本词义标注系统,测试结果表明,与同......
随着微博逐渐成为人们获取、发布信息的重要媒介,网络中每天都会产生海量的微博及其评论数据。如何以一种有效的方法,剔除垃圾评论......
词的分类问题是语言学和自然语言处理中十分重要的研究问题。由一些语义相近的词组成的词类(或词聚簇)可以看成是纷繁的个别词现象......
属性选择的核心思想是要在原属性全集的基础上,通过一定的算法和模型去除那些缺乏识别能力和预测能力的冗余属性,得到的新属性子集......
词义标注是自然语言处理的难题之一.该文提出用于文本词义标注的转换规则自动获取算法及相应的词义排歧算法.该算法用可能的句法关......
提出结合知网的知识对内部-外部算法予以扩展,并利用扩展的内部-外部算法实现汉语的语义依存分析。实验结果表明,扩展的内部-外部算......
提出汉语语义分析的方法,具体策略是借用依存语法作为表示框架,通过在基本内部—外部算法中结合知识识别句子中的依存关系。实验结......
语义网是依托互联网技术而产生的一类非常重要的资源。目前,语义网中的用户查询仅支持形式化的查询方式,因此需要严格地遵循某种特......
该文提出了一种基于卷积树核的无指导中文实体关系抽取方法。该方法以最短路径包含树作为关系实例的结构化表示形式,以卷积树核函......
本文探讨中医临床诊断得到的“望”、“闻”、“问”、“切”的四诊数据的统计分析方法。在没有中医专家的证候诊断结果(即无指导)的......
基于句子的相似性,提出了无指导的汉语句法结构推导方法.基本思想是:首先,在汉语句子库的基础上.通过句对之间的对齐,得到交替的相同片断......
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态......
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算......
在入侵检测建模过程中,特征提取是一个重要的步骤。特征提取有利干提高入侵检测的效率和准确性,好的特征可以在特征空间提供完美的分......
针对现存的基于EM(Expectation maximization)迭代的无指导词义消歧方法收敛缓慢、计算量大的问题,利用互信息和Z-测试结合的方法选取......
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法,以期对研制开放环境下健壮的分词系统有所裨益.全部分词知识源自从生......
古汉语与现代汉语有很大区别,古汉语研究直接套用现代汉语成果并不可行。目前的古汉语现有研究使用的方法相对陈旧。随着深度学习......
针对Web应用的攻击种类繁多、变化多样,基于静态规则库的旧的防护体系已经很难适应当前Web应用安全的新状况,提出了将无指导学习方......
古汉语文本中,汉字通常连续书写,词与词之间没有明显的分割标记,为现代人理解古文乃至文化传承带来许多障碍。自动分词是自然语言......
为实现谓语动词对论元的自动选择,提出基于最小描述长度(MDL)和潜在语义聚类(LSC)的语义优选方法。基于MDL原则计算与动词搭配的名词的......
属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往......
针对传统入侵检测系统建模与更新需要大量人工参与,提出一种基于数据挖掘的无指导自适应入侵检测系统。系统通过有效结合聚类、关......
语料库语言学的发展的核心问题是语言模型的建立问题。常用的语言模型可以概括为三类:(1)n元模型(及隐马尔可夫模型);(2)基于分布理论的模型;(3)基......
共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度......
该文以一种有效的方法寻找出有价值的微博评论,这对于读者更高效地阅读评论,为舆情分析、文本挖掘等任务提供支持,均具有重要的应......
汉语自动分词是中文信息处理中的一项基础性课题,同时也是智能化中文信息处理的关键所在。与此同时,随着WWW的蓬勃兴起以及电子出......
自从计算机被发明以来,人们就想知道它能不能学习。机器学习从本质上是一个多学科的领域。它吸取了人工智能、概率统计、计算复杂......
提出了一种基于竞争的自激励神经网络学习算法SIN,该算法综合了自适应谐振理论和竞争型神经网络的特点,并在隐含层采用了Hebb学习......