主题提取相关论文
新媒体技术的发展极大地改变了传统媒介的传播方式与传播格局,各类新媒体平台不断涌现,使得原有点对面的封闭传播模式向点对点、去......
互联网技术的高速发展带来了教学信息化,包括大规模在线开放课程(Massive Open Online Course,MOOC)在内的线上教学模式,既有作为补......
随着中国经济的不断发展,我国的消费水平也在不断提高,生活垃圾的产量也显著增加,已逐渐成为阻碍我国各个城市发展的重要因素。在......
政协提案是委员提出的关于社会热点和急需解决的问题,并对问题进行分析、提出自己的意见或建议的形式。北京市政协目前已经完成提......
随着互联网产业应用发展的不断深入,人们生产生活各个方面都深受影响,随之产生的各种文本数据呈爆炸式增长,这些文本的数量变得异常庞......
本文研究的重点是中文多文档自动文摘中的几个重要问题:主题的自动提取、文摘句的选取、系统的自动评价.具体地讲,本文从如下几个......
随着Internet及大容量存贮技术的迅速发展,Web上的信息日益丰富。从海量、异构的Web信息源中获取用户所需要的知识是一项很难的事情......
[目的/意义]针对突发公共卫生事件,借助自然语言处理技术,快速挖掘舆论热点和舆情演化特征,提升政府部门的应急管理能力。[方法/过......
伴随着信息技术的不断更新以及互联网的快速发展,网络中的数据呈现出了几何级的增长速度,其中社交网络及信息传播过程中积累的数据......
企业社会责任的概念自提出以来,一直是企业管理范畴的研究热点。作为一个社会科学的研究对象,经过学术界和企业界长期地争论,由于......
伴随着互联网发展和智能设备的普及,网络舆情的影响越来越大,企业以及政府机构也越来越重视网络舆情的应用和管理。网络舆情的应用......
随着大数据时代的移动通信技术及计算机网络技术的发展,互联网行业发展迅速,体现在社会化网络社交平台、互联网金融平台等各个方面......
通过对已发表论文的分析,掌握研究领域的发展状况,对研究人员具有重要意义.面向此类需求,提出一种基于扩展Bcp指数的领域主题发展......
本文主要研究了语音主题提取的全部过程:主要由语音数据的预处理、文本表示、特征提取、参数估计、模型训练和主题分类提取组成,以......
随着人工智能技术的快速发展,服务机器人已经逐渐进入了日常生活的各个领域,正扮演着越来越重要的角色。同时语音识别和自然语言处......
互联网科技的日新月异和不断普及,使互联网的信息与日俱增。搜索引擎的出现,为精确、快速地寻找需要的信息提供了非常大的帮助。大约......
科研论文是科学研究的重要表现方式,是引领技术发表的指南针.对论文发表流程的把控是保证论文质量的关键.在论文的发表过程中,为其......
针对微博文本简短、格式内容散乱、信息描述不完全、数据噪声大导致无法高效获取微博主题的问题,提出一种基于 LDA改进的 SMLDA模......
传统的主题提取算法存在一些已知的问题.为了更好地满足SEWM-2004中文Web检索测评中的主题提取任务要求,分析经典的基于超链接分析......
从文本中提取主题串是自然语言处理的重要基础之一.传统的提取方法主要是依据" 词典加匹配"的模式.由于词典的更新速度无法同步于......
随着Internet网络的日益普及,W eb上的海量数据给文本挖掘尤其是网页主题提取带来了更多的挑战,现有的文本提取方法在保证高准确率......
本文引入HowNet知识库,实现中文文档的概念聚类.提高文本聚类分析的效率;应用形式概念分析的技术对概念聚类后的中文文本类簇的主题进......
试图从另一个角度来考察主题提取算法HITS,即提出一种基于相似度的链接分析模型来观察主题提取的过程.通过给出一种一般化的相似度......
文本检索会议(Trec)是信息检索领域一年一度的学术交流和系统评测活动,本届Trec的Web Track任务由命名网页发现/主页发现子任务和主......
通过吉林市等城市的成功试点,中国移动已经决定将数据集市作为2006年移动地市级公司的建设重点之一。这也同时意味着,电信行业建立在......
本文对主题搜索引擎中的网络蜘蛛搜索策略进行了详细的分析,在深入分析主题页面在Web上的分布特征与主题相关性判别算法的基础上提......
互联网的飞速发展产生了"信息过载"问题,新闻推荐系统可以帮助用户快速找到符合自己兴趣的新闻。文章完成了一个基于主题推荐的新......
论文根据微博文本所具有的特点,将微博文本具有的三种的特殊符号:“@”、“//”和“#”纳入微博主题提取的分析中。在传统的LDA模型......
支持向量机(SVM)在各类别样本数目分布不均匀时,样本数量越多其分类误差越小,而样本数量越少其分类误差越大.在分析这种倾向产生原因的......
从互联网短文本数据中获取与提取出有价值的信息是目前机器学习研究的热点。在本研究中,以某网站中关于"规划投资"新闻标题的短文......
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确、搜索信息量......
针对微博文本简短、格式内容散乱、信息描述不完全、数据噪声大导致无法高效获取微博主题的问题,提出一种基于 LDA改进的 SMLDA模......
LDA(Latent Dirichet Allocation)是一种从文档资源中抽取主题的概率模型,将其用于文档的主题提取通常具有不错的效果。档案信息资......
基于LDA算法原理,提出了两种对语料库提供先验知识的改进策略。一种为对语料库中特定词性的词汇进行增删以进行相对定向的主题词的......
科学引文网络反映了科学知识的动态演化,作为一个复杂的网络系统已得到广泛研究。针对引文网络中主题不明确和热点问题不易跟踪的......
HITS算法是影响相当广泛的链接分析算法。但是,深入的研究表明,它很容易产生主题漂移。而HITS算法产生主题漂移的很大一部分原因在于......
提出一种基于认知复杂度度量的文本推荐模型。已有的认知复杂度评价方法主要用于评价单一文本的认知复杂度,对此方法进行拓展,将它用......
人们通过互联网对同一主题进行搜索时,会通过链接展现出许多包含主题的相关网页,为了使用户更加准确地找寻到有用信息,或更快更方......
以一个自行开发的搜索引擎系统为背景研究主题提取算法,通过对几种经典主题提取算法的分析、融合,提出了一个新的主题提取算法。用该......
研究在线评论文本,能从学习者角度科学提炼MOOC质量的影响因素,客观评判MOOC的教学效果。基于此,文章提出了基于学习者在线评论文......
主题提取是文本的处理的一项重要工作。本文首先分析了主题抽取中加权方法形成时的一些定量问题,然后提出了主题相关词一种非线性加......
主题抽取是自然语言处理研究的重要问题之一。目前流行的方法是“词典+匹配”,但该方法用于处理动态变化的网页信息时,词典难于及时更......
网络舆情具有时效性强、传播迅速、涉及方面杂而广、意见指向性特征明显、泛娱化特征明显等特点。因此,提出对LDA输入数据采用TF-I......
考虑Web页面表现形式对主题相关度的影响,提出了一个基于文本样式的Web主题提取算法。该算法解析Web页面中的文本样式,根据不同的文......
电影数据是一个多模态数据集,包含影片、导演和演员3种不同模态的数据,且不同模态的数据类型不同.如何从这些多类型数据中提取特征......