主题抽取相关论文
【目的】利用LDA主题模型探索分类视角下的主题提取与分布状态,全面深入地揭示学科知识结构和热点。【方法】以国内知识流领域为研......
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确......
短语作为搜索引擎输入的主要信息,其主题抽取对于搜索引擎判断搜索者的搜索意图,提高搜索服务质量具有重要的意义。短语逐渐成为网络......
Internet是新兴的信息发布和流通媒体,其中文本信息占整个互联网信息总量的60%,由于缺乏类似于传统媒体一样对信息发布的监控手段,大量......
面向主题是数据仓库的特征之一,面向主题是指数据仓库中的数据是按照主题进行组织的,合理地选取主题是数据仓库设计成功的前提条件......
2020年初爆发的新型冠状病毒肺炎疫情使得我国医疗资源不足、分配不均的问题被进一步曝光与放大,因此在此次疫情中帮助迅速调配医......
网络新闻文本规模大、传播快,已成为信息传播的主要方式,面向新闻文本的主题抽取也在不断完善.随着主题模型的发展,出现了不同于聚......
考虑到文档中出现频率较高的词语能够体现文档的主题,设计了一种中文文档主题抽取算法.该算法首先对目标文档进行预处理,然后计算文档......
提出了一种基于多因素的文本主题的提取方法,并着重讨论了相应的权值体系。根据概念间的相互关系,对同义概念进行语义归并和上下位......
主题抽取是意见挖掘的核心任务之一。该文面向维吾尔语评论文本,针对显式主题和隐式主题,提出了一种陈述级的主题抽取方法。该方法......
为了克服传统主题词抽取算法中的主题漂移与主题误判等问题,提出了利用词的共现信息来提高主题词抽取的准确率。根据词汇与文本中......
传统的主题抽取方法单纯依靠分析网页内容的来自动获取网页主题,其分析结果并不十分精确.在WWW上,网页之间通过超链接来互相联系,......
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国......
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,......
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自......
传统文本情感分类方法通常以词或短语等词汇信息作为文本向量模型特征,造成情感指向不明和隐藏观点遗漏的问题。针对此问题提出一......
在分析突发事件新闻文本特点的基础上,提出了一种基于加权信息论的主题抽取方法,与传统的方法相比,该方法既考虑了主题词在文本中......
购物网站或者APP中的在线商品评论是用户生成内容(User GeneratedContent,UGC)的一个重要体现,对于辅助消费者购买决策及帮助商家......
提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分 析,建立词之间的语义关联,并生成代表某一主题......
随着网络新闻类型门户网站的不断增多,如何从纷繁复杂的Web信息中得到我们需要的新闻标题成为了一个问题。这里通过正则表达式对门......
互联网舆情是人们在互联网上对某种社会现象或社会问题的具有一定影响力和倾向性的共同意见,近年来,互联网舆情对政治秩序和社会稳......
本文针对应急预案自动主题抽取的需求,采用词汇语义相关度计算的方法,构建了一个基于词汇链算法且符合人的主观感受的主题抽取模型。......
常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题。因此需要寻求较低成本、较快速的方法进行学科热点和趋势......
语义相关度的计算方法在信息检索、文本挖掘和自然语言处理等方面有着广泛的应用,而其算法种类很多,这些算法针对不同的应用环境具有......
[目的/意义]对社会科学视角下Web主题结构挖掘研究的最新著作进行述评。[方法/过程]从数据采集技术、主题信息抽取和专题Web信息资......
网络上存在海量中文文本资源,其中许多具有稀疏性与不规范性,难于处理与挖掘.百度百科是一个丰富的与社会热点、网络流行紧密相关......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
科技资源已成为推动科学技术进步、提升国家科技实力的关键性因素,但科技资源的孤岛问题严重阻碍了科技资源共享服务。在分析科技......
分析文献主题是挖掘科学脉络的基础,目前存在多种提取文献主题的方法,被学者广泛使用的方法是使用概率主题模型抽取文献的主题。使......
[目的/意义]以汽车论坛例,提出一种针对专业社交媒体文本的主题知识元抽取方法。[方法/过程]首先,通过LDA模型提取出汽车论坛中文......
[目的/意义]潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋......
中小学校园安全是顺利开展教育活动的基础,关系到中小学生的家庭和谐以及社会稳定,校园安全事件已经成为一项社会各界关注的热点问......
[目的/意义]在互联网数据呈爆炸式增长的今天,如何提高情感分析的效率和准确性,从中挖掘更细粒度、更深层次的情感内涵成为学者们......
随着互联网的快速发展,微博、电子商务、论坛、微信等网络平台已经得到了广泛的应用,这些网络平台所产生的短文本信息都以数据流的......
网络舆情分析工作中的一项关键任务是识别新闻之间的多次转载关系,进而确定目标事件舆情在互联网上的分布状况和传播范围。基于网......
微博平台已发展成为网民讨论社会热点事件和分享日常生活的重要社交平台之一。这些用户产生的内容(user generated contents,UGCs)......
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K—Illeans聚类的主题挖掘算法......
提出了基于综合方法的主题句的提取方法,并着重讨论了文本主题概念的提取以及相应的权值体系.根据概念间的相互关系,对同义概念进行语......
主题抽取是文本自动处理的基础工作之一,而主题的抽取一直以分词或者抽词作为第1步.由于汉语词间缺少明显的间隔,因此分词和抽词的......
随着互联网技术的迅速发展以及网络电子地图的日益更新,以POI为代表的空间地理数据也出现了快速的增长。POI即兴趣点,它一般包含名称......
近几年随着互联网技术的迅猛发展,网络成为消费者发表评论、意见等信息的重要平台。虽然海量的信息资源可以为我们带来极大的便利,但......
面对网络上日益丰富的评论信息资源,如何在海量的客户评论中快速有效的获取并使用其中的有效信息,成为人们日益关注的问题。研究目......
基于主题聚类的主题数字图书馆是针对某一个特定的主题,获取与该主题相关的数字资源集合(本文以文本资源为研究对象),然后再依据主......