基于文本挖掘的政府资助项目新兴主题识别与发展趋势预测研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:ismyaccount
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的发展和大数据时代的悄然来临,从大量的、有噪音的数据中抽取出代表未来学科发展方向的新兴主题成为各级政府及科技政策制定者关注的问题。与此同时,根据前沿发展方向进行产业发展方向制定和科学部署结构分布成为科技机构抢占科研机构的关键所在。  在新兴主题研究领域,逐渐形成了较为成熟的理论和研究方法,比如基于论文分析数据源的引文分析方法、共被引方法等传统情报学研究方法,以用来预测和分析学科发展的新动态。与此同时,基于论文的研究方法,因其分析数据源为存在时间滞后性的数据源,无论研究和探测方法如何进行修改和改进,都无法改变论文时滞性的本质属性。  本文以美国国家科学基金会(National Science Foundation, NSF)的政府资助项目文本为分析数据源,综合运用主题模型、机器学习、可视化分析等技术,识别出蕴含其中的新兴主题,从而对未来主题研究进行预测分析。本文研究可分为三个步骤:主题概率识别、政府资助项目新兴主题识别、新兴主题预测分析,具体来讲,主要是:  (1)基于PLDA模型的主题概率识别模型研究。基于概率模型深入文本内容,识别出政府资助项目文本中的主题词及相关权重分布,利用主题相似度建立主题关联构建。  (2)政府资助项目新兴主题识别。分析政府资助项目文本的资助强度、资助金额以及主题强度等指标,建立一套基于政府资助项目文本分析的新兴主题探测公式,分析该文本中主题的发展及演化情况。  (3)基于机器学习模型的新兴主题预测分析与可视化研究。将采用机器学习中相关理论和方法,对数据进行滑动窗口处理,建立时间序列模型,对未来学科发展主题进行预测分析。  实验结果表明,本文提出的新兴主题识别、预测与可视化分析技术可以有效识别出蕴含在政府资助项目中的新兴主题并对其未来发展进行预测分析,从而为科技政策制定者提供决策支持和决策参考,为我国进行学科调整和重点研究领域的部署提供理论和技术支持,从而围绕未来发展方向进行科研创新,提供科研效率。同时,本文利用政府资助项目文本中的三个主题特征进行识别并构建新兴主题探测模型,未来将进一步对相关特征进行分析与验证,完成新兴主题探测体系。
其他文献
在当代国际社会,科技创新已经成为决定一个国家在复杂的国际竞争环境里繁荣富强、取得进步以及获取成功的关键因素。对于我国建设创新型国家、推进中国特色国家创新体系建设,早
这是一个重物轻人的年代,尤其是在产业与经济领域。消费者关心的是如何获得价廉物美的商品;供应商考虑的是怎样以最低的价格得到它;制造商琢磨的是如何以最低的成本生产它。
期刊
我永远不会忘掉那个夜晚,它比我所经历的其他夜晚加在一起还要不可思议。那是在一个裸露出大块红壤的陌生小镇。很少的房子,几棵怪模怪样的树,一个小旅馆,墙体由片岩堆砌而成
期刊
物流在社会经济活动中,特别是在电子商务环境下,不仅能够创造时间价值和空间价值,还能够创造信息价值,是商品和服务价值的增值过程。现代物流管理使得物流具有高效的配送、满意的
学位
现在想来,他来时,我应该是在看那篇写宠物狗的散文。我的确感觉有一点动静,像风刮起树叶,或者是纸张在掀动,我并没有多想,接着看稿,看到这一句:“突然,一阵急促的脚步声打破
期刊
一rn晨光初现,从窗帘的缝隙望出去,天空像只青色的蟹壳.园子里果树上刚泛黄的果儿引来几只雀儿叽喳不休.老海一夜翻腾着没有睡好觉,眼睛发涩,心里不清静,因为三女儿海花张罗
期刊
一rn桂林城里,六根是吃书法饭的,一支毛笔打天下.那支毛笔是托人从湖州特制的,笔杆选用斑竹,紫褐色的竹皮上撒着点点斑痕,称之美人泪.牛角收口,管顶嵌一段翠玉,绿莹莹放着温
期刊
政府信息公开是现代国家的一项重要民主制度。推进政府信息公开,不仅有助于塑造政府的亲民形象,也是构建和谐社会的有效途径之一。我国各级政府为电子政务的建设投入了大量的人
随着多媒体资源类型和数量不断增长,多媒体日益成为图书馆馆藏的一个重要组成部分,对描述多媒体资源的元数据规范也提出了更高的要求。  本文选择多媒体资源的元数据规范为研
那些孩子,在空中欢快地翻腾,他们像春笋那样,从土里长出来,自由自在徜徉于天地之间。从照片中,你似乎也看到了人的生老病死、子子孙孙的轮回。“摄影就是上帝给你的礼物,作为
期刊