wikipedia相关论文
在中文自然语言处理中,命名实体识别(NER)是中文自动分词的一个重要步骤:同时,由于命名实体的识别课题必须解决词的边界界定、上下文......
作为自然语言处理的基本操作,词性标注能提供关于单词及其邻近成分的大量有用信息,因此常常是组成复杂应用的模块之一。词性标注任......
对词语之间和词对之间的关系进行量化测度是自然语言处理的重要研究内容之一,相关研究成果在信息检索、语义消歧、机器翻译等自然......
基于Wiki的开放式协作内容生产方式和开放式协作社区在新一代网络中日益盛行,开放式协作内容不仅在社会化媒体受到欢迎,更引起学术......
针对特定领域提出了一种结合词向量和图模型的方法来实现实体消歧。以旅游领域为例,首先选取维基百科离线数据库中的旅游分类下的页......
分析了维基百科的基本现状,尤其是关于维基词条质量的统计分析结论,研究了维基百科中"基于相关性分析"和"基于模型"这两种词条质量......
以典型的群体合作编辑应用——维基百科作为分析对象,从词条、编辑者以及词条和编辑者之间的编辑关系等三个方面入手,总结了近年来......
在网络社区中由于标签的标注过程具有随意性和多样性,一个标签通常有几种含义,导致标签的准确率较低,因此在网络协作标注过程中标签的......
结合信息增益,提出了一种新的自适应主题爬行策略。利用维基百科的分类树和主题描述文档构建主题向量T,并在爬行过程中不断地进行......
理解维基百科词条链接网络的结构特征是深入而有效地应用维基百科的前提。基于2010年1月的数据,从度分布、权分布、宏观结构特征等......
提出一种基于维基百科的领域实体发现方法,该方法将构成领域实体的典型字或词作为种子元素,利用少量种子元素作为实体发现的初始知......
针对为检索服务的语义知识库存在的内容不全面和不准确的问题,提出一种基于维基百科的软件工程领域概念语义知识库的构建方法。以S......
社会网络分析能够对社会网络中行为者之间的关系进行量化分析,以可视化的图形界面展示节点之间的深层关系及群体结构。本文从维基......
利用维基百科备份数据库自动构建领域概念语义网络,为领域信息智能检索提供技术基础。对维基百科备份数据库进行下载、分析、筛选......
本文介绍了华盛顿大学图书馆的数字馆藏,以及被公认的Wikipedia现象,同时还介绍了对Wikipedia文章添加链接的过程以及我们从华盛顿大......
社会网络分析是研究社会关系的一种新兴的研究方法,它能够对社会网络中行为者之间的关系进行量化分析,以可视化的图形展示行为者之间......
词语语义相似度计算在自然语言处理如词义消歧、语义信息检索、文本自动分类中有着广泛的应用。不同于传统的方法,提出的是一种基......
维基百科是由全球志愿者协作完成的以网络为基础、免费的百科全书项目,也是Wiki技术影响力最大的应用典范。维基百科在学术领域的......
维基百科收录的文章和参与编辑的用户日益增多,其中不乏一些用户对同一条目持有不同的见解.该文旨在发现维基百科中的争议性文章,......
介绍了维基知识库词条的内容质量控制标准及控制策略;分析了维基知识库元数据质量控制中存在的问题,并提出控制策略;最后分析数据......
[目的/意义]利用关键词解决维基百科文章中的大量冗余信息问题。[方法/过程]在关键词提取的基础上,以维基百科文章的编辑历史为时......
针对目前短文本词汇量少、表达形式多样,导致同种类文本聚类方法无效的问题,提出一种利用中文维基百科的丰富词汇间关系对短文本的......
针对当前地理信息数据来源单一、获取困难的问题,提出一种基于维基百科数据库转储文件的地理信息数据抽取新方法,首先解析数据库转......
文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语......
wiki在国际图书馆界是非常有名的沟通和交流的网站平台,但在国内图书馆的应用并不广泛。论文主要介绍了Wiki的基本概念及发展历程,分......
wiki在国际图书馆界是非常有名的沟通和交流的网站平台,但在国内图书馆的应用并不广泛。论文主要介绍了Wiki的基本概念及发展历程,分......
论文以维基百科为研究对象,介绍其用户需求表达平台,基于用户贡献的信息资源供给方式,用户共同协作的信息资源管理方式,以及维护网站有......
基于复杂适应性系统理论将维基百科用户抽象为内容添加者、内容修改者、内容删除者、多样编辑者和内容浏览者5种主体,建立了群体协......
针对当前常用爬虫爬行策略的不足,提出结合维基百科和网页相似度分析的主题爬行策略。利用维基百科分类树的结构对主题进行描述;下载......
研究中文维基语义图上的网络论坛话题追踪,对于提高舆情分析系统获取情报的效率及信息处理质量有很大价值。以涉军主题帖子为背景,借......
作为全球传播力与影响力最大的协同参与式互联网百科平台,维基百科一方面为中国拓宽对外传播路径、树立大国形象、提升国际话语权......
在网络信息飞速增长时代,搜索引擎技术的应用也越来越广泛,而专业性搜索引擎技术成为发展的趋势.为了适应当前的发展需求,文章提出......
实体链接是指给定实体指称项和它所在的文本,将其链接到给定知识库中的目标实体上。由于微博内容存在特征稀疏、用语不规范的特点,......
维基百科作为一个多语种的大型知识库,正逐渐被人们应用于不同的领域。剖析维基百科的基本结构,分析对从信息盒、类别结构和定义句......
为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用雏基百科进行特征扩展以辅助中文问题短文本分类。首先通过......
互联网下同一领域中不同知识概念间存在多种关系,其中演化关系对于用户学习和理解领域知识,梳理领域知识的前序和后续逻辑关系具有......
<正> 最近网上让我叹服的一件事就是Wikipedia(英文网址:www.wikipedia.org,中文网址:http://zh.wikipedia.org/),它是由一些热心......
PFIBF方法是一种基于Wikipedia链接关系建立关联词典的方法。该方法仅仅对Wikipedia中的概念进行分析,而忽略了出现在概念解释文档......
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体......
通过Wikipedia构建甘肃中医药知识协作网络进行开放式的知识创造及传播,可充分利用不同知识节点的网络扩散优势增强其传播效果.......
针对词语语义相关度计算缺乏统一模型框架与典型随机游走模型PPR( Personalized PageRank)中的问题,提出基于维基语义图的词语语义相......
词语相关度的计算是自然语言处理关键技术之一,在信息检索、机器翻译、词义消歧、句法分析等领域有广泛应用。国内现有大部分词语相......
采用开放协同编辑模式的维基百科,其内容的精确性一直受到人们的质疑。除了极少部分被维基百科认定为高质量文章外,维基用户很难判断......
wikjpedia作为一个大型的知识库,正逐渐被人们应用于不同的领域。在本体构建领域,wikipedia以其丰富的组织结构为大规模协作式的本体......
Wikipedia是基于Wiki技术的目前全球最著名的英文网络百科全书,它利用超级链接构建化学信息网络,展现大量的化学知识及与相关情境素......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
利用WOS(Web of Science)和Wikipedia两种数据源,对大数据相关的内容进行词频统计、文本归类分析,得出两种数据源下大数据主题的共......
伴随着Web2.0技术革命,互联网上的意见型文本呈爆炸性地增长,这些文本蕴含着广大用户的喜怒哀乐。意见挖掘技术应运而生,人们围绕......
随着云计算技术的不断推进,云计算平台的发展逐渐呈现多元化趋势,继前几期Google、Ning、好看簿、EDU2.0、百会等平台之后,本期将......