自动抽取相关论文
情报课程是情报学教学体系的核心和灵魂,是新的情报学人才培养模式的基础。在大数据、数据科学、人工智能发展的大环境下,数据学科......
本文叙述了等线体和圆头体汉字曲线轮廓字形的自动生成系统.该系统从黑体汉字曲线轮廓字形中自动抽取骨架单线体,结合等线体和圆头体......
随着互联网技术的发展,Web逐渐变为更主流的用户信息反馈平台。其中用户评论信息为政府决策、企业发展提供更为具体化、细节化的用......
文章从传统知识组织系统和现代知识组织系统两方面介绍了知识组织系统构建研究现状,并从术语自动抽取及统一知识组织系统自动映射......
随着网络技术的迅速发展,Internet已成为大多数人们表达自己观点和获取信息的平台。越来越多的商家通过网上出现的大量评论信息,了......
口语翻译是语音、语言技术领域重要的研究方向之一,具有巨大的应用价值。口语翻译涉及到语言学、计算机科学、语音识别、语音合成和......
传统的基于实例的机器翻译方法对语料库规模要求极高,而在语料库规模不够的情况下存在精确匹配率不高、模糊匹配译文质量差等缺点,......
本文对汉语术语的抽取进行了一定的研究,设计了一个统计方法和规则方法相结合的汉语专业领域术语抽取算法,并具体实现。在本文的实验......
文本数据挖掘技术是自然语言处理研究的重点问题之一,而工程图文档是工业技术中的重要数据媒体之一。在信息时代,同其他多媒体数据......
随着Internet的飞速发展,网络中包含着海量可以被利用的数据。其中由Web数据库返回并根据预定义模板展现在用户响应页面中的数据记......
近几年,大量丰富而有价值的数据在网络中趋于深化,隐藏在查询接口后面的在线数据库中。这些“Deep Web”数据与基于静态网页的“Surf......
词汇之间存在多种关系,如:上下位关系、同义关系、反义关系、整体-部分关系等等。其中,作为重要语义关系的一种,上下位关系是描述事......
本文研究从BBS主题网页中自动抽取用户发言信息的问题。该类问题的传统解决方法主要基于对HTML网页的DOM树和标签结构的分析,密切......
术语集中承载特定领域的核心知识,术语的自动抽取能够辅助人们便捷地获得和积累该领域知识,而双语术语更是兼有两种语言的映射关系......
针对PBmice小鼠信息系统功能扩展的需求,文章提出并实现了PBMICE-SR语义检索框架。检索框架在PBmice系统基础上提供了智能获取数据......
万维网的迅猛发展,引起了Web数据的急速膨胀。面对泛滥的海量Web信息,“富数据,贫知识”的现象引起了越来越广泛的重视。为了解决......
随着计算机技术和网络技术的不断发展,海量信息以电子文档的形式出现在人们面前。从这些自然文本中提取出有用的信息,日益成为人们......
地理信息与知识是组成客观知识世界的重要内容。互联网上大量的地理信息都以非结构化的文本形式存在,如何利用智能化的方法,从网页......
随着互联网的高速发展,网络信息成爆炸式增长,百科知识已经成为人们获取知识的重要手段。人们对垂直化知识的需求对百科知识库提出......
复述是含义相同而表达方式不同的词、短语和句子。例如,英文单词“film”和“movie”为单词级别复述又称同义词或近义词;英文短语......
由于文化与地域的差异,中国大陆、香港和台湾(简称大中华区)在汉字的书写和表达习惯上均存在着一定的差异。从形态学角度看,香港和......
20世纪90年代以来,互联网技术快速发展,网页页面样式也越发多样。现时的网页中,充斥着大量的导航、广告等与页面主体内容无关的信息,这......
随着互联网技术的发展,Web成为各种应用与研究的重要数据源之一,为信息检索、数据挖掘等领域提供高质量的数据。Web中一类重要的数据......
网络化创新外包是企业借助互联网手段获取外部创新力量完成创新研发任务的行为,已经得到企业、人才和学者等的广泛认可,但其发展仍......
【摘要】本文介绍了基于MSHTML设计开发的网页信息表格化提取程序的原理、程序结构和工作流程,使用网页信息提取、网页元素解析、采......
目的:构建结构化的方剂信息数据库,挖掘方剂中药物之间的关联规则,进一步研究方剂的配伍规律。方法:运用基于正则表达式的信息抽取......
元数据是关于数据的数据。元数据标准的使用和推广有利于资源的规范描述和共享,由于资源的多样性和应用的不同需要,元数据标准多种多......
信贷与资金监测分析系统是农发行河北省分行依托省级综合报表平台系统,为解决业务部门希望对原有各系统业务数据进行综合分析的迫......
“小世界”现象源于社会学家Milgram在十九世纪六十年代对社会网络的分析。近年来,随着Watts与Strogatz等一批数学家,物理学家创造性......
二十世纪以来,世界各国造船业为了在日益激烈的竞争中求生存、求发展,竞相引进先进设计制造技术,加快造船技术进步,努力提高质量,降低成......
安徽省黄山市公共资源局自成立以来始终坚持“制度+科技”的监管思路,以制度夯实监管基础,以科技提升监管能力,积极构建全覆盖上下一......
机采血浆是通过单采血浆机及一次性采血浆耗材自动抽取血液并分离出血浆,然后再自动把血细胞回输给献浆者的过程。整个采浆过程是在......
参考远程指纹识别系统在自动抽取十指纹中心花纹特征点时的特点,结合实际情况,减少现场指纹中心花纹的特征编辑对比对结果的不利影......
针对有向无环图支持向量机的元数据自动抽取机制问题进行了分析和研究,提出了基于此抽取机制和W3C资源描述框架的生物信息数据中的......
在教育教学信息化的进程中,试题管理系统和组卷系统一直是人们致力研究的一个领域,对教育教学的自动化、高效化和精准化具有重要的......
概念是本体的核心,人工抽取领域本体概念存在工作量大、速度慢、维护及更新困难等问题。以压铸模领域概念抽取为例,通过分析领域概......
本文介绍了一种针对化学数据分析的挖掘系统原型实现和设计理论.阐述从化学数据分析的角度开发一个联机分析数据挖掘系统原型的理......
现阶段国内最先进的一个查询搜索技术就是互联网视听节目监管系统,该系统具有将各类媒体信息进行综合分析的功能,所以必须要具备适用......
因特网信息越来越多地被学者们引用,但准确引用这些信息却不容易。文章分析了目前国际及国内相关的引文规范。介绍了自动化引用电子......
利用机器学习和自然语言处理技术中的有关方法,研究从语料中抽取概念关系为领域本体构建服务。对等级关系以及领域关系的抽取方法作......
索引词的自动提取和检索模型是全文检索的关键技术.本文论述了索引词的自动提取和检索模型所使用的主要技术进行了论述.......
本文以沈阳市沈北新区的三所大学和途经这三所大学的两条交通线路为例,构建了一个城市交通本体的片段作为实验本体,在此基础上给出......
双语词典是跨语言信息检索以及机器翻译等自然语言处理应用的基础资源。为了利用双语语料库获取汉英词典,在对三种常见的基于共现......
互联网视听节目监管系统是采用当前最先进的搜索、内容分析技术,结合多媒体信息检索的最新成果,应用多模态信息集成,在一个系统内集成......
主题词在信息处理和信息检索过程中有广泛的用途 ,然而大量网页没有主题词 ,手工抽取主题词是一个繁重的过程。可以将主题词自动抽......
关键词自动提取一直都是自然语言处理领域的一个基础问题与研究热点,随着文本数据的指数级增长与应用场景的不断扩展,如何高效且准......