主题相关性相关论文
大数据时代,越来越多的应用场景不再使用单一来源的数据进行刻画,而是采用多源数据融合的方式进行研究分析,以提高研究结果的全面......
[目的/意义]科技文献推荐是指根据学者的研究兴趣,自动地为其推荐文献资源。借助于文献推荐,学者可以快速发现优质文献,提高论文的......
文本情感分类是文本处理的重要研究领域,对于互联网舆情监管、信息获取、信息过滤等信息内容安全领域的研究具有重要意义。本文对......
近年来,随着社会的不断发展和科学技术的不断进步,信息飞速增长。信息爆炸带来了电子文档的快增长,文档的检索、分类和管理变得越......
近年来,互联网的飞速发展让人们在体验网络带来的便捷的同时,也给人们检索到有用的资源带来了前所未有的挑战。目前,人们在网络上......
人名歧义是一种身份不确定现象,现实中同一个姓名可能被多个实体人物所使用,这种情况都会产生人名歧义。随着Internet的发展,网页......
随着在线社交网络的逐渐兴起,越来越多的互联网用户开始广泛通过在线社交网络发布信息、传递资源和维护各种社会关系。由于在线社......
健康干预效果系统评价的可靠性参差不齐.因此,政策制定者及支持者需评价此类证据的可信度.采用系统透明的评价过程可避免判断时出......
目前国际上比较有前景的新兴学科大多具有跨学科性质,跨学科研究成为当代科学探索的新范式。促进跨学科研究已经成为国家政府、高......
网页中的超链接包含主题定位和超文本信息,经研究表明,由超链接相连的网页之间的主题相关性大大高于没有相连的网页,超链接中的文本信......
互联网与信息技术的发展导致网站信息资源出现爆炸式增长,为了更好的管理和利用网站信息资源,网站信息架构优化得到广泛关注。元数......
随着互联网的普及和电子商务的快速发展,网络评论、论坛讨论已成为人们网络生活的重要部分,并影响着社会舆论导向。如何识别网络评......
当代雕塑中视觉性和主题相关性成为雕塑设计的重要元素.文化场所雕塑景观因其特殊属性引起人们的关注.麻省理工学院雕塑景观与基地......
随机冲浪模型;顺序关系;主题相关性;句子重排...
提出一种基于页面空间特征、视觉特征和内容特征的主题相关性判别方法,通过主题相关度大小量化描述不同内容的重要性,并采用混合加......
互联网技术的发展已经渗透到了社会生活的各个方面,其中基于主题的互联网信息采集技术的发展,能够有效地提高税源信息的准确性。文......
摘要:今年是辛亥革命100周年,该文在普通爬虫的技术基础上以主题相关性为核心构建辛亥革命史主题爬虫,从而保证该主题爬虫所搜集网页......
句子相关性计算在自然语言处理的多个实践应用中均具有十分重要的作用,如舆情监测、信息检索、统计机器翻译等。在明确相似性与相......
为了从团伙犯罪中锁定核心犯罪嫌疑人,提高侦破案件的效率,本文提出了一种改进的PageRank算法分析团伙犯罪中各犯罪嫌疑人的嫌疑度......
迅速发展的Web给传统的搜索引擎带来了前所未有的挑战,面向特定主题或特定领域采集相关信息的垂直搜索引擎应运而生。在垂直搜索引......
基于原著改编而成的特别展览是让文物与文字同时“活”起来的一种全新尝试。此类展览的策划需要经历跨文本解构(编创)、意象式再现(演......
面向主题的Web信息采集需判断提取的URL链接主题相关性。基于主题链接上下文提取,主题型语义块采用提取链接周围一定长度的文本,目......
为克服主题爬虫主题漂移现象,提高搜索引擎的查准率和查全率,提出了一个基于PageRank算法与Bagging算法的主题爬虫设计方法。将主......
面对互联网中庞大的数据,怎样获取所需要的信息形成了研究所面对的一个难题。而Web数据挖掘这门学科的泛起为这个难题提出了解决方......
信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的......
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并......
网页链接的主题相关性影响页面的权威性计算,传统的HITS算法仅从页面的链接结构评估页面的权威性,易导致主题漂移。对HITS算法进行了......
为了提高网页排序算法的效率,提高搜索引擎的检索质量,提出了融合反馈信息与内容相关度的PageRank改进算法。利用向量空间模型计算......
领域用户的信息需求范围依赖于领域本体产生的完全信息量,而领域本体的完全信息总量是相对恒定的。因此基于领域本体的信息搜索,可以......
为解决现阶段文本情感摘要方法缺乏的问题,提出一种基于改进情感关键句抽取的情感摘要生成技术。利用TFISF抽取文章的关键词,分析......
网络爬虫是一种自动获取网页内容的程序,通常作为搜索引擎的重要构成从互联网上抓取网页。近年来,互联网的飞速发展使得网络信息呈......
目前,我国地名数据库建设存在大、中颗粒度地名集中,小颗粒度地名较为缺乏,地名资料陈旧、时效性较低,简称、别名等非标准地名信息......
提出一种将主题相关性和网页新旧程度与PageRank算法结合,得到改进的PageRank算法TRTPR(Topic Relevance and Theme PageRank).本......
税收是国家财政收入的主要来源与国家宏观调控的重要工具。但伴随着我国经济的快速发展,税收流失现象也越来越突出,已经影响了税收......
用户对农业信息的需求越来越多,农业搜索引擎的开发变得十分必要.从农业搜索引擎发展状况出发,在分析研究通用搜索引擎工作原理、......
近年来,高校内图书馆资源恶意下载频发,电子资源商一旦发现恶意下载,将立即停止违规IP/IP段的使用权限,使得高校内所有用户无法正......
由于通用搜索引擎返回的信息过多且主题相关性不强,使部分企业未能及时获取高校招标公告,错失中标机会。针对这种情况,提出了高校......
[目的/意义]近年来,分析研究某学科或领域的研究热点已成为重要的研究方向和内容,但并未系统地对基于高被引论文的研究热点识别方......