基于关键词关联度指标(KRI)进行LDA噪声主题过滤的方法研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jchangmafco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]针对LDA模型主题识别结果通常包含噪声主题的问题,建立科学有效的主题过滤方法,排除噪声主题,确保主题识别及后续演化分析的准确性.[方法/过程]基于关键词之间的共现关系,构建关键词关联度指标(KRI),借助定量手段进行主题筛选和过滤.以单细胞研究领域为例,计算各主题-关键词分布的KRI值,与人工判读结果进行对比分析.[结果/结论]实验结果表明,该方法能够有效排除LDA模型识别结果中的噪声主题,提高主题识别的准确性,也在一定程度上降低了主题识别过程对人工判读的依赖性.
其他文献
[目的/意义]在数字时代背景下,分析档案文献编纂成果传播的影响因素,为提升档案文献编纂成果的传播力提供借鉴和参考.[方法/过程]基于拉斯韦尔5W模式和问卷调查构建档案文献
[目的/意义]通过构建档案文献编纂成果用户满意度模型,为档案文献编纂成果的有效利用和用户满意度的提升提供数据支持和参考.[方法/过程]通过查阅文献和调查问卷等方式确立档
党的十八届三中全会指出,“经济体制改革是全面深化改革的重点,核心问题是处理好政府和市场的关系,使市场在资源配置中起决定性作用和更好发挥政府作用”.在药品领域逐步建立
期刊
[目的/意义]数字时代档案文献编纂人员胜任力模型的建立对于选择符合要求的编纂人员、最大化运用档案机构人力成本、提高档案文献编纂成果的质量有着重要意义.[方法/过程]对
[目的/意义]用户参与是图书馆融合用户智慧共创服务价值的重要手段,确立用户参与图书馆知识服务的重要性和合理性,有助于强化用户参与的作用和效果,为图书馆知识服务中的用户
[目的/意义]针对数字图书馆在发展过程中存在的“信息孤岛”等问题,构建一种新型的数字图书馆信息资源安全共享模型,以打破资源拥有者与需求者之间的壁垒,改善数字图书馆资源
[目的/意义]读者通过移动终端获取图书馆信息服务的需求日益凸显,但移动图书馆的服务模式建设却存在开发形式单一、人文特色匮乏、服务效果不佳等问题.通过实例调研与分析研
[目的/意义]分析高校图书馆微信公众号信息服务项目的共现关系及其对信息传播影响力的影响.[方法/过程]首先,总结归纳高校图书馆微信公众号的信息服务与信息传播影响的相关研