bootstrapping相关论文
随着网络技术的迅速发展,Internet已成为大多数人们表达自己观点和获取信息的平台。越来越多的商家通过网上出现的大量评论信息,了......
随着计算机应用的普及和近年来因特网的发展,特别是Web网的迅猛发展,信息的增长规模在速度上达到了空前的水平。如何协助用户更加......
学位
词义消歧在自然语言处理的许多应用领域中具有重要的理论和实践意义,是一个影响着自然语言处理领域中许多其他应用问题的“中间问......
本体作为共享概念模型的形式化规范说明,具有良好的概念层次结构和语义表达能力,已经引起越来越多国内外专家学者的关注,并在知识......
随着信息技术的快速发展,互联网上产生了大量的非结构化的文本数据,其中包括:新闻,博客,政府文档,聊天日志等。如何帮助人们快速地......
随着数据处理和存储技术的进步,科研数据的有效管理和基于数据的研究行为均得到越来越多的关注。为更好地对数据使用行为进行研究,......
Bootstrapping一词,来自于20世纪初期美国流传的一句“提着鞋带把自己举起来”的谚语,讲的是美国人不依赖外力,而靠自我实现成功的......
This paper presents a method to learn semantic lexicons using a new bootstrapping method based on graph mutual reinforce......
针对目前各种加密技术应用的特点,提出用硬盘序列号和网卡序列号作为机器指纹来分别对不同类型的软件进行加密认证的技术,该技术的......
随着认知计算的飞速发展,通用知识图谱的自动构建取得了极大的进步,但在垂直领域由于缺乏本体等语义信息,导致进展缓慢。叙词表广......
随着认知计算的飞速发展,通用知识图谱的自动构建取得了极大的进步,但在垂直领域由于缺乏本体等语义信息,导致进展缓慢。叙词表广......
语义模式的自动获取是解决信息抽取系统可移植性问题的语义模式自动获取方法.该方法是一种新的双循环自举机制,由内自举和外自举两......
运用经典的和修正过的重标极差方法研究了在1999到2009上证指数中的波动率和收益率的长期依赖关系。运用具有预白(pre-whitening)和......
二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种......
A new approach of relation extraction is described in this paper. It adopts a bootstrap- ping model with a novel iterati......
针对旅游点评类文本存在数据量庞大等问题,本文构建一种SVM与Bootstrapping相融合的旅游点评文本情感分析算法。首先对2019年上半......
期刊
词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建......
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规......
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规......
目前的实体关系识别方法, 无法充分利用海量未标注军事文本中的潜在信息, 并且在实体关系特征词提取方面并不完善.于是本文对实体......
获取概念的属性信息有助于构建概念间的关系,进而改进基于概念的信息检索等应用的性能。研究了如何从机器可读词典中获取释义项的......
统计量分布的确定是统计推断的一个关键工作,在总体分布已知的条件下,鞍点逼近在很多场合可以给出统计量分布的良好近似.在介绍鞍......
本文提出一种小脑模型极限学习机,并应用于电力负荷的不确定性预测。在预测过程中,考虑模型和数据的不确定度,并结合bootstrapping......
针对在建筑工程中风险的复杂和碓预计性,把工程中的风险归结为五大风险因素:场地、经济、政治、设计、环境。运用Bootstrapping方法......
大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域......
设计并实现了带有主题词结构的政府公文分类系统,在公文分类预处理过程中充分利用主题词所携带的类别信息,运用随机关键词产生技术......
设计并实现了带有主题词结构的政府公文分类系统,在公文分类预处理过程中充分利用主题词所携带的类别信息,运用随机关键词产生技术......
文章介绍了自助抽样法的基本步骤并以工程实例说明了基于少量岩土数据所得平均值、方差的不准确性,并简单有效的量化上述的不确定......
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种......
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种......
提出一种基于支持向量机和自扩展的实体关系抽取方法.用于解决实体关系抽取研究中测试语料库缺乏的1"-3题。采用自扩展方法自动学习......
提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集......
高分辨率归一化自举微分相似系数(Normalized Bootstrapped Differential semblance,NBDS)速度分折方法为地震资料的高分辨率速度分析......
从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过boo......
提出了一种基于自扩展的本体学习方法用于获取领域术语.该方法只需提供少量种子术语和一个未标注语料库作为输入,由种子术语开始学......
当前科技论文抄袭比较严重,但针对科技论文抄袭的自动检测的研究还不够。科技论文的抄袭检测是重复的表示形式之一,可按照改动的程......
提出一种以词性为参考值的文本挖掘算法,能有效挖掘与种子词有关的关联规则。基于Bootstrapping算法思想,既减少了预处理阶段对于词......
提出一种以词性为参考值的文本挖掘算法,能有效挖掘与种子词有关的关联规则。基于Bootstrapping算法思想,既减少了预处理阶段对于词......
产品评论挖掘用来对用户发表到网络上的众多评论内容进行信息提取,从而获得用户对产品的部件或功能的褒贬评价。现有的产品评论挖......
确定实体间的关系有助于理解文本,提高信息检索的正确率。该文研究中文实体关系模板的获取技术,提出了一种STG的bootstrapping训练方......
实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱......
精密单点定位技术(Precise Point Positioning, PPP)可以利用单台接收机在全球范围内进行静态或动态独立定位,能够直接获得静态厘......
预测问题作为决策的重要环节一直以来都受到人们的关注并持续研究。目前大多数研究都着眼于对点的预测,即给出精确值作为预测结果,模......
近年来,随着人工智能和机器学习的快速发展,计算机视觉也进入了发展的黄金时期,吸引了众多学者以及企业的目光。行人检测是计算机......
近年来,随着大量知识的产生,知识图谱正在发挥着越来越重要的作用,其中,知识库就是构建知识图谱的关键,然而这些知识库往往缺乏一......
语义标注是一个在领域分类指导下,为文档填加规范化知识表示的过程。表示结果可应用于面向文本的知识挖掘、智能检索等其它深层分析......
本文以X效率为主线,利用DEA二步法考察了1997—2002年间中国14家商业银行技术效率、配置效率和X效率的变化情况。其中DEA用以计算各......
随着互联网的快速发展,微博(microblogging)逐渐兴起。近几年来,微博逐渐渗入到人们生活的方方面面,人们不仅在微博中接受到各种各样的......
学位
大量文本以电子形式存在,人们需要对大量的文本信息资源进行有效的组织和管理,因此文本分类引起人们的高度重视。近年来,关于文本......