文本预处理后的LDA模型主题发现与技术演进研究

来源 :农业图书情报 | 被引量 : 0次 | 上传用户:deiaw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]在科技情报资源快速增长的环境下,通过大文本数据分析快速发现研究主题,且进一步挖掘各研究主题下的技术发展与变化,对做出全面快速响应的科技情报工作有着重要的意义。[方法]针对大文本数据,利用Python实现了文本预处理后的LDA模型主题发现与技术演进,首先构建文本预处理泛化模型,实现技术词自动识别处理;然后基于技术词进行LDA模型构建及可视化,来识别研究主题;最后基于技术词构建技术演进的计算模型,来进一步挖掘技术的发展与变化。[结果]文章以SiC技术领域43621项专利为分析对象进行了实践,包括文本预
其他文献
幼小教育是基础教育的组成部分,是学校教育是终身教育的起始阶段关注儿童的全面发展,重视儿童基本能力和素质的培养,指导、监督、幼小教育教学,促进农村幼小事业发展。
介绍了CAPP系统的开发及原理,并以集成环境下异形支座类零件CAPP系统的开发为例 ,重点讨论了CAPP系统在集成环境下的开发、研究及实践,其设计思想对于开发类似的异型零件CAD/CAPP集成系统有一定的参考价值.
高职院校存在一定的后进生,要培养出适应社会需要的第一线应用型高技能人才就必须要做好后进生的转化工作,全面提高学生的整体素质。在实训教学中,从创建和谐的师生关系、培
目的主要是探讨我院老年住院患者病种情况及其变化趋势。方法收集我院2006年至2008年60岁及以上住院患者的病案统计资料20743例,按国际疾病ICD-10进行分类。结果发现60岁以上
企业安全管理是企业安全文化的一种表现形成,是企业安全文化在企业安全管理中的某些经验化、理性化不断发展和优化的体现,科学的企业安全管理也属于企业安全文化建设的范畴。两
文档一体化怜理为信息资源的合理的利用和科学管理提供强有力的帮助,进而为社会提供高效优质的信息服务。采用计算机技术,可使文档一体化管理的优越性得到充分的发挥,最大限度地
目的对产后出血的原因及其相关危险因素进行系统分析和探讨。方法对2014年3月至2015年3月我院产科74例产后出血孕产妇的临床资料进行回顾分析,总结和归纳产后出血的原因和相
中医药文化深深熔铸在中华民族的生命力之中。体现了人与自然和谐发展的思想。中医院照片档案的利用与开发,使照片档案在提升中医药文化内涵中发挥作用。
目的对我院心房颤动住院患者的病因及抗凝治疗进行分析。方法对2013年2月至2015年2月98例心房颤动住院患者的治疗情况和临床资料进行回顾性分析。结果阵发性房颤45例(45.52%),