词共现相关论文
在互联网飞速发展的当今社会,社交媒体平台已经成为了人们日常生活中的“聚集地”。人们可以时时地在平台上抒发自己对某人、某物......
随着互联网技术的迅速发展,网上信息飞速增长。如何从这些海量信息中检索出所需要的相关信息已成为一个非常重要的研究课题。而由......
[目的/意义]从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考.[方法/过程]通过分析传统微博主题......
运用文献计量的方法对我国共词分析领域的相关文献进行多角度的定量和定性分析,分析了国内共词分析文献的作者合作情况、期刊分布等......
针对文本挖掘中存在的特征空间高维性问题,提出了一种基于词聚类的文本特征描述方法,旨在通过机器学习的方法挖掘词汇之间的语义关......
为了实现从海量的船舶事故调查报告中自动提取出水上交通安全知识,提出了从词语和主题2个层面对船舶事故调查报告进行语义挖掘的方......
答案选择任务的精度对问答系统、文本处理等应用的效果具有重要的影响。针对答案选择模型问句与候选答案句语义信息和句子浅层特征......
传统的话题发现研究主要针对于长文本及新闻数据集,大规模短文本具有稀疏、无结构、多噪等特点,传统方法很难有效发现话题。提出了......
文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型(Vector Spa......
通过词频统计及词共现等方法,对2000—2011年中国重要报纸上有关民办高等教育的新闻报道在新闻数量、刊登载体、分类统计、主题分布......
利用CiteSpace对学科服务进行作者合作、机构合作和关键词共现等可视化分析并绘制科学知识图谱,理清我国学科服务的发展脉络和现状......
针对现有关键词提取算法存在计算复杂、语义信息挖掘较浅等问题,提出一种基于频繁模式挖掘的中文关键词提取算法.该算法采用改进的......
摘要:使用STU-DOM这种网页提取技术,在实际操作过程中,在对不含超级链接的网页噪音进行判断时,准确性较低,同时,这种技术也不能有效处理D......
在软件开发全生命周期中,需求跟踪在管理需求及其相关制品方面扮演着重要的角色.由于手工跟踪费时且易出错,一些基于信息检索(info......
查询词扩展要解决两个方面的问题:一是扩展词的来源,二是如何在来源集合里挑选扩展词项.对此,首先利用检索结果聚类和排序模型获取......
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出......
目前大多数文本自动分类系统都采用向量空间模型(VSM)来表示文档.针对常规的VSM文档表示方法不能反映概念的问题,文章对VSM进行了......
语义检索的关键技术就是语义扩展。文中利用基于带衰减因子的词共现模型计算公式来获得词与词之间相关性信息资源.从而给出了用于信......
为了克服传统主题词抽取算法中的主题漂移与主题误判等问题,提出了利用词的共现信息来提高主题词抽取的准确率。根据词汇与文本中......
通过技术预测的量化趋势演化模型,预测挥发性有机物(VOCs)的新技术和技术发展态势,从而为该领域提供技术路径方案。基于专业术语、......
提出了一种利用词共现技术自动构建概念图的方法,首先进行词条选择,并计算词条之间的关联强度生成关系矩阵;接着,从关系矩阵中挖掘......
文本主题是文本聚类的关键,而文档中共现词对对文档主题的表现力非常强。因此,在对现有文本主题挖掘和共现词对抽取算法深入研究的基......
文中提出了一种基于向量空间模型的词共现模型算法 ,通过选取整篇文档为窗口单元 ,统计中高频特征词的共现信息 ,改进了模型的效果......
研究了现有的关联分类算法在文本分类中的应用,发现对于有结构的文本数据,关联分类算法未考虑文本的语义信息导致分类精度不够理想,为......
针对查询扩展中局部分析方法查准率不高的缺点,提出一种新算法。该算法通过分析与用户查询密切相关的文档,从而得到与其相关的文档......
概念空间在信息组织和帮助用户表达信息需求方面起到了重要作用,但目前研究构建的概念空间主要是一般意义上的概念空间,即具有严格体......
基于关键词集的中文文本特征表示方法难以准确表示文本语义信息,从而导致聚类质量较差.为了解决这个问题,本文将本体论和词共现模......
为提高领域观点词的抽取效果,主要研究了词共现和词上下文对领域观点词抽取的影响。引入词上下文生成同义词词表的方法,使用词上下文......
针对文本检索中所使用的查询词可能与文本词语不匹配而影响检索效果这一问题,提出了一种基于上下文的查询词扩展的方法,该方法根据......
针对传统的信息检索方法采用基于关键词匹配的模式,导致查询效率低下的问题,利用同义词对查询术语进行扩展,提出了一种用于信息检索的......
提出并实现了一种带衰减因子的词共现模型,可以自动生成包含词与词相关性信息的资源.由于该模型考虑了词与词之间距离的概念,同普......
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结......
随着互联网平台信息传播方式的多样化,微博作为一种最受欢迎的社交网络平台,实现了信息从发布、传播到接收的实时性,用户可以最快......
随着网络的普及,互联网逐渐出现在人们生活的各个角落。以互联网为平台的针对用户的服务和应用也逐渐丰富起来,极大的丰富了人们获......
[目的/意义]在线用户在社交网络分享产品的体验,即便是同种产品的评论,往往包含不同的子话题(产品的不同方面)。面向在线评论的子......
随着电子计算机应用技术的日益成熟和互联网应用的迅速发展,社会信息化进程加快,人类进入了一个信息爆炸的时代。因此能够使人们在海......
以ISI的WebofScience数据库为数据来源,采用词共现方法和基于距离的相似性度量算法对原始矩阵进行处理,通过多维尺度和系统聚类分析......
关键词作为文本的概要信息,是信息检索,特别是针对海量Web信息处理的基础。由于手工分配关键词是一项耗时性的工作,因此不需要训练......
为解决文本主题表达存在的信息缺失问题,提出一种基于词共现的文档聚类算法。利用文档集上的频繁共现词建立文档主题向量表示模型,......
随着信息技术的发展与社会信息化进程的加快,数字化的信息呈爆炸式的增长,已经远远超出了人类的理解与概括能力。利用计算机从大量......
商品排名很大程度上促进商品的销量,如何提取优质的关键词是商品排名中的关键问题。传统的关键词提取算法基于词频或者词语间的相......
互联网上每天都会报道许多新闻事件,为了挖掘各事件问的关系,提出一种新闻事件关联建模方法。该方法首先利用TF-IEF和相邻词合并策略......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
在文本检索中,由于用户需求的表达方式不充分,常会得到大量无关信息,给用户检索带来诸多不便。本文提出的基于词共现的文本相似度......
随着互联网的发展,海量的信息涌向网络。我们需要用“大数据”来表示需要同时进行批量处理或分析的种类繁多的大量数据集,数据的计......
文章以CNKI数据库中收录的专利地图研究文献为研究对象,采用文献计量、社会网络分析方法,分析了近十年来我国专利地图研究的现状,......
在计算广告学中,为用户查询返回相关的广告一直是研究的热点。然而用户的查询一般比较简短,广告的表示也局限在简短的创意和一些竞......
现如今移动互联网和智能终端的发展越来越快,已经渗透到了社会的各个角落,新的医疗健康信息化服务模式应运而生。在这个人口逐渐老......
对中文电子病历中的否定术语进行检测,可以为非结构化的电子病历文本的概念索引的建立提供依据。对于电子病历中术语的提取,在经典......