基于词相似性与CRP的主题模型

来源 :”数字化中医信息系统“临床术语本体研究专家研讨会 | 被引量 : 0次 | 上传用户:cntele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主题模型(Topic Model)用于提取隐含在文档集中的主题,其中每个主题是语义相关的一些词的多项式分布.在文本挖掘中,主题模型不但可以发现隐含在文档中的语义信息,而且能够实现文档的维度约简.本文对主题模型的产生背景、研究现状、研究方法以及存在的问题做了较详细的阐述,并针对LDA(Latent Dirichlet Allocation)主题模型不能自动确定主题数目的问题,提出了一种结合词相似性与CRP(Chinese Restaurant Process)的隐主题模型,该模型能够较快地自动确定合理的主题数目,并产生主题上的词分布.在模拟数据和中医临床诊疗数据的实验中,该方法获得了较好的分析结果.
其他文献
本研究介绍了利用名中医诊疗信息采集及分析挖掘平台开展中医治疗肿瘤的证候特征、肿瘤不同时期的治法、核心处方及加减用药规律等方面的研究,有利于系统总结肿瘤的辨证及治
室内瓶插花易谢,按下面方法可保鲜15~20天:剪去茎根部叶片,用急火烤一下茎根,这样既可保持茎内储藏的养料,又防腐烂;瓶内水量要充足,但切忌水齐瓶口,以免影响花枝吸氧: Indoo
为了就流产问题详细调查,我们采访了第三军医大学大坪医院妇产科主任李力教授和现代女子医院计生科主治医师刘建梅。他们分别就流产手术和避孕措施两个方面作了回答。关于流
胖给我带来的烦恼我有个响亮的绰号——“大力士”,听到这个名字,你们一定以为我是身高七尺的boy吧!错!错!错!我是个典型的girl。我才13岁但体重却足有80公斤,蝉联“全校体重
文献计量学可以对学科发展态势进行信息挖掘和分析,可视化是文献计量学发展的热点方向之一。基于文献计量方法和GIS的空间分析功能分析了1994—2018年全球地球科学领域的发展态势,并将发文量、主要发文作者和研究机构的地理分布、研究重心时空迁移等研究结果可视化。结果表明,全球地球科学研究的科研产出明显增多。地球科学研究的发文重心逐渐往北半球的东南方向迁移。国际合作在逐年加强,越来越多的国家参与到地球科
目的:用数据挖掘方法研究中医治疗糖尿病冠心病的用药规律,指导临床遣方用药. 方法:本研究通过对应用结构化糖尿病住院病历临床信息采集系统采集的2型糖尿病(T2DM)病人的
会议
摘 要 新课程的基本理念是面向全体学生,注重素质教育,以学生发展为本。课外作业是初中英语教学的一个重要的环节,它和课堂教学、课外活动等一起构成了完整的教学体系。从培养兴趣、真实性、差异性、发展性原则设计课外作业,注重作业设计的实操性、多样性和发展性,从不同的角度设计作业形式,有利于贴近学生的实际生活,增强英语学习的趣味性,提高学生学习的兴趣,符合学生的认知发展水平。  【关键词】初中英语;课外作业
本文针对中医临床处方论治中的药物配伍和药症关系等问题,研究采用改进的Biclustering算法(调整cHawk方法的阈值计算、偶图的最小交叉和聚类簇标记等过程)进行分析。为提高cHawk
会议
The long-term warming of the ocean is a critical indicator of both the past and present state of the climate system. It also provides insights about the changes
期刊
目的:基于名老中医肝脾不调证临床实际数据,分析其诊断肝脾不调证的标准. 方法:选择肝脾不调组医案734例,非肝脾不调组医案771例作为对照组,将其临床表现转化为结构化信息
会议