【摘 要】
:
[目的 /意义]探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势.[方法/过程]提出一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点.[结果/结论]实验表明本文提出的方法对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭
【机 构】
:
清华大学公共管理学院,北京100084
论文部分内容阅读
[目的 /意义]探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势.[方法/过程]提出一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点.[结果/结论]实验表明本文提出的方法对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具有良好的揭示.[创新/局限]提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单元和语法结构.
其他文献
[目的/意义]对近几年的人民日报语料中文分词结果进行统计和分析有利于总结新时代的中文语料在分词歧义方面的规律,提高分词效果,促进中文信息处理的相关研究和技术的发展.[方法/过程]本文以2015年以后的共4个月新时代的人民日报分词语料为研究对象,通过统计词频、词长、从合度等信息,从名词、动词、数词、量词、副词、形容词、区别词、方位词、处所词、时间词、代词、介词、连词、助词、习用语、否定词、前后缀等类型来讨论变异词的切分规律.[结果/结论]结果发现新时代的人民日报语料中的切分变异大部分为假歧义,相同语法结构的
[目的 /意义]大数据背景下,数据密集型科研时代已经来临,对高校研究生数据素养的评价能够帮助了解现状,推动数据素养教育的完善和优化.[方法/过程]本研究在相关研究的基础上,构建基于数据生命周期的高校研究生数据素养评价指标体系,包括4个一级指标和18个二级指标.通过问卷调查收集数据,利用BP神经网络对评价指标体系进行验证.[结果/结论]数据分析结果表明,所构建的评价指标体系具有一定的实用性,并能够对大数据背景下的高校研究生数据素养教育提供借鉴和参考.[创新/局限]本研究的局限性主要有两个方面,一是样本的选择
[目的 /意义]为了进一步提升学生评教信息的使用价值,构建在线教学用户需求指标体系,对在线教学需求数据进行主题挖掘.[方法/过程]运用数据挖掘理论和LDA主题识别模型,从丰富的在线教学评价内容中挖掘潜在的在线教学主题,针对教学主题特征向用户需求进行结构映射,最终形成在线教学需求指标体系.[结果/结论]分析在线教学数据,从教师需求、课程需求、教学成果需求三方面构建在线教学用户需求指标体系,并提出针对性的教学质量优化策略.[创新/局限]本文通过在线教学需求数据主题挖掘,为高校在线教学评教指标体系的构建与完善提
[目的 /意义]网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文本挖掘是情报分析的重要内容.[方法/过程]为了更有效从海量网络用户在线评论文本中挖掘用户感兴趣的信息,本研究爬取TripAdvisor网站四大城市的酒店用户在线评论,基于主题图谱理论和文本聚类算法构建网络用户在线评论的聚类模型,通过图谱可视化揭示不同地区酒店用户观点差异,并分析不同图谱的社会网络特征.[结果/结论]研究发现酒店用户最关注的是服务,其次是酒店的环境和位置.本研究能够快速挖掘酒店用户关注内容,对帮助酒
[目的/意义]互联网数据中隐藏着的消费心理、消费需求等消费者情报对提升企业竞争力意义重大.对用户购买行为产生及演进机制的发掘,不仅能让企业掌握更多自身产品和服务中的具体细节信息,还能从本质上发现用户的需求偏好,推进企业实施科学经营决策.[方法/过程]本文提出一种利用因果事理图谱的消费者情报获取方法,以京东平台手机在线评论数据源为例,首先通过利用基于规则和依存句法分析结合的自然语言处理技术对数据源之间的因果关系变量进行识别和事件知识抽取,再结合LDA模型进行事件聚类,最后利用Gephi可视化等方法实现对用户
[目的/意义]为了发现更全面、更具有普适性的反恐情报信息,本文在单层次关联规则挖掘的基础上研究反恐情报的多层次关联规则挖掘方法.[方法/过程]根据反恐情报的数据特征提出统一最小支持度和多单项最小支持度参数并用的方式筛选多层次涉恐特征频繁项集,在情报分析过程中保存部分特殊的冗余频繁项集、冗余多层次关联规则和无趣多层次关联规则.[结果/结论]本文的研究可以发现涉恐数据中不同概念分层的关联规律.[创新/局限]文中提出的关联分析方法能够弥补普通的单层次关联规则挖掘在分析包含多层属性的涉恐数据中存在的不足,为反恐预
[目的/意义]探索微信传播可视化农产品营销信息的传播途径,有利于提升可视化农产品营销信息传播效率.[方法/过程]通过阐述可视化农产品内涵及其营销信息传播过程中面临的现实问题,理论分析出微信传播模式是可视化农产品营销信息传播的有效模式,进一步剖析可视化农产品营销信息在微信群聊、微信公众号、微信小程序等模式下的传播途径.[结果/结论]可视化农产品作为农产品的一种新型产销模式,其传统的营销信息传播模式必须做出变革.[创新/局限]微信营销信息传播促进资源跨界整合,微信小程序将“线上系统”+“线下系统”+“可视化监
[目的 /意义]我国“互联网+政务服务”发展迅速,在线政务服务资源日益丰富,民众能否通过搜索引擎查找到政务服务是影响在线政务服务平台成效的重要因素.政务服务资源搜索的主要目标是“查准”,研究提出关于中美政务服务资源搜索引擎可见性的八个假设.[方法/过程]按照查找典型政务服务个人事项“申领机动车驾驶证”和法人事项“注册有限责任公司”的需求构造中英文关键词,分别通过百度和谷歌,以定位到中国各省和美国各州经济最发达城市为目标进行搜索实验,采集首页搜索结果并进行相关性评分.在此基础上进行搜索引擎搜索功能的统计分析
[目的/意义]开放科学时代,融合Altmetrics指标进行中国英文学术期刊话语引导力特征分析与评价,有助于丰富和完善中国特色学术期刊评价理论与指标体系.[方法/过程]首先从宏观层面对评价指标进行了描述性统计分析和分布规律的探究;从中观层面对不同学科评价指标分布特征进行了揭示;从微观层面对不同国际合作情况下评价指标的分布特征进行了解析.其次,根据评价指标特征及内涵,构建了评价指标体系.最后,采用相关分析、集成因子分析与熵权法和TOPSIS法优势,融合Altmetrics指标对中国英文学术期刊话语引导力进行
[目的 /意义]互联网的飞速发展为区块链技术创新提供了良好的环境.作为最先进的信息技术之一,区块链发展到一定阶段,必然寻找赋能实体经济的突破口.金融是实体经济的血脉,区块链在金融领域的应用是赋能实体经济的最有效途径.区块链金融演化,离不开数字驱动和信息再造.[方法/过程]通过文献研究法可知,数字驱动加速了区块链技术创新;通过辑分析法可知,信息再造催化了区块链金融演化;通过案例分析法可知,数字驱动下区块链期货的信息再造主要是源于区块链金融去中心化、自证信用、可编程性、提高质量等特征;通过演绎演绎法可知,数字