基于概率主题模型的短文本自动分类系统构建

来源 :国家图书馆学刊 | 被引量 : 0次 | 上传用户:tiantangdaoguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网平台的蓬勃发展产生了以新兴媒体为承载的数字资源,如何从中有效实现知识检索、知识发现成为信息管理领域和互联网技术领域的一个重要课题。本文以《中国分类主题词表》为主题词受控表,首先从词的粒度层面对语料数据进行短文本信息挖掘,其次基于隐含狄利克雷分布(LDA)模型切分文本内容,最后依据词频统计实现主题词的提取、聚类,并通过共现矩阵构建短文本自动分类系统。该系统一方面有效地实现了知识的快速聚类和关联自动分类,另一方面为用户提供了满意度更高的知识发现服务及相关扩展服务。图8。表5。参考文献16。
其他文献
日前,中国人寿保险股份有限公司为满足广大客户不断增长的服务需求,对现有理赔服务体系进行全面整合、优化,理赔服务再次"提速",理赔手续更为便捷高效,客户服务体验得到进一步
2014年,云南省烟草农业科学研究院(以下简称省烟科院)精心制作"专家课堂、《技术手册》、《技术指导》、《病虫情报》、专家110"五道"科技大餐",零距离服务生产,加速科技成果转化,
“乖乖,这不佩服不行,3000多亩水稻用遍药,若是放在过去得百十人忙活一两天,现在用‘小飞机’,半天就能解决问题。”“徐剑这小伙子就是有眼光,投资购机不仅帮了我们忙,而且自己也有
云南省普洱市镇沅县是一个山区县。这里山高林密,溪流淙淙,风景秀美,自然生态条件优越。这里有一种很受欢迎的特色农产品——瓢鸡。那么,瓢鸡有什么特别呢?畜牧师李应明:"跟普通
一、经济和生态价值1.经济价值。秃杉林木边材、心材区别明显,边材浅黄色,心材紫红褐色。秃杉木材色泽美观,具香气,年轮明晰、纹理通直,结构细致、均匀,材质较轻软,天然耐腐
在农村种植、养殖、加工、外出务工以及生产经营管理的实践中,各地不断涌现出许多土专家、田秀才、种养大户和致富能手等。这些农村乡土人才摸索积累的小窍门、金点子,往往更接
一、烘烤中常见的主要问题1.把握不好烘烤工艺,将烟叶烤枯烤杂。除田间烟叶素质不好外,大部分足烘烤不当造成的。一些农户习惯于"红大烟叶难变黄,要低温变黄"的做法,导致在33℃
据海关总署消息,当前我国农产品走私活动处于一个高发阶段,直接危害国家粮食安全和食品卫生安全。为此,全国海关正展开为期一年的打击农产品走私“绿风”专项行动,全力遏制农产品
根据医学教育的特点和我们的实践经验,我们认为医学院校可以试行学年学分制,必修课仍按学期学年开设。同时在选课的类型、数量上给学生一定的自由度。这样做有利于推动教育研
问:投保人身保险的一般流程是什么?答:1、客户选择保险公司和产品,并提交投保意向。2、保险公司业务人员为客户提供产品咨询并设计保险方案。3、客户填写投保单并交纳首期暂收保