基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zeuswugeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(LatentDirichletAllocation)主题模型的CBOW-LDA建模方法,该方法对目标语料进行相似词聚类后再完成主题建模,能有效降低文本输入维度,使主题分布更明确。采集Stack Overflow网站上2010-2015年的问题帖数据集POST,并对其进行实
其他文献
分析了我国精细化工发展的现状,并针对当前存在的问题,提出了今后发展的建议.
如果仔细地研究一下1999年以后的高考试题,我们不难发现:对三角问题的设计。充分表现有如下的四个“性”,即主体知识的聚合性,思想方法的通用性,能力考查的层次性,解题方法的多样性
“倒数”是一种常见的运算法则,如果我们在数学变换中依据条件和目标特征,巧妙地利用“倒数”,往往可以达到柳暗花明的效果.
军队后勤保障社会化是今年后勤改革的重头戏,本文拟就这个问题从它的客观要求、基本思路以及在实施过程中须注意的几个问题,谈几点认识。
摘 要:阐释“共抓大保护、不搞大开发”和“水利行业强监管”的重要意义,介绍以推动河湖长制“有名”“有实”为主线,以河湖管理检查、“清四乱”常态化、岸线利用项目清理、长江经济带生态警示片问题整改为重点的推进河湖“强监管”工作成效,并对推动建立河湖监管长效机制提出建议。  关键词:长江大保护;河湖长制;监管  中图法分类号:TV213.4 文献标志码:A DOI:10.1967
三支决策是不确定问题求解的重要理论。经典的决策粗糙集模型通过计算三支区域总体决策最小化风险,给出了一种有效的三支决策阈值求解方案。然而对于决策粗糙集理论中代价目
2020年11月,除印度之外的15国正式签订《区域全面经济伙伴关系协定》,全球最大的自贸区,占全球总量1/3的超级经济圈应运而生,RCEP的签订是东亚区域合作极具标志性意义的成果
随着全面依法治国的实施,特别是湖南省省以下法院、检察院(以下简称法检两院)财物省级统管改革以来,全省法检两院审判、检察执行案件连年增加,办案任务日益繁重。法检两院普
电网公司的电费敏感客户往往对由用电引发的电量、电价、电费、缴费、欠费等电力服务具有强烈反应。快速定位电费敏感客户,对降低客户投诉率、提升客户满意度、树立供电企业