中文文献自动分类中的知识库构造及其仿人算法

来源 :情报学报 | 被引量 : 0次 | 上传用户:wangfeiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文阐述了自动分类中的仿人思想 ,并用分类域模型来描述中文信息自动分类中的分类法 ,通过计算类别特征项在分类域中的Hamming距离 ,对类别特征项依据其在分类域中的类别分布进行聚类 ,从而实现对向量分类法中的特征向量维数的压缩 ,并进一步构造用于中文自动分类的知识库。 This paper describes the human-like thinking of automatic classification, and uses the classification domain model to describe the classification of Chinese information automatic classification. By calculating the Hamming distance of the category features in the classification domain, Class distribution, so as to realize the compression of the dimension of the eigenvector in vector classification and to further construct a knowledge base for Chinese automatic classification.
其他文献
目的:   研究急性缺血性脑卒中患者血清骨保护素(OPG)水平的变化,及其与缺血性脑卒中TOAST病因分型之间的关系。   材料与方法:   收集急性脑梗死患者63例,对照组28例
目的:SOX2是维持胚胎干细胞自我更新能力和分化潜能的胚胎干细胞相关基因。在低分化及未分化肿瘤中,肿瘤细胞具有很多与胚胎干细胞相似的特性,这提示SOX2可能在实体肿瘤中有表达
盆栽试验结果表明,玉米、油菜和黑麦草等植物能够直接利用片麻岩中的矿物结构钾。不同种类的植物对矿物结构钾的利用能力有显著差异,而且矿物粒径的变化对钾的植物有效性影响很
目的:探讨脐血内脂素与白细胞介素-6(IL-6)的水平与新生儿窒息的关系,以及探讨脐血内脂素与白细胞介素-6(IL-6)与新生儿窒息Apgar评分的相关性。方法:收集2014年7月至2015年6
根据棉花生理代谢的特有规律,对抗逆性物质、植物生长调节物质、叶面助剂、矿质养分等进行筛选,确定了棉花专用叶面肥配方的基本组分,配制出五种不同特性的叶面肥用于室内筛选,研
根据渭北旱塬合阳旱棚冬小麦微区试验结果,分析了不同降水年型下不同施肥技术的冬小麦增产效应、肥料利用率和冬小麦生育期土壤供氮状况(以NO-3-N含量为指标)。结果表明歉水年型下施肥
古代官员也有公休假,但轮到值班或有任务在身,仍得去所属机关办公。宋神宗元丰二年(1079)的某个公休日,身为皇亲国戚的退休高官李端愿在家宴请馆阁翰苑官员。翰林学士孙洙(字
血管重塑性疾病发生发展的病理生理机制是目前心血管领域研究的热点问题之一,而血管平滑肌细胞(Vascular smooth muscle cell,VSMC)过度增殖在高血压、动脉粥样硬化、血管成
GfK市场咨询公司行业与策略研究所总监叶平根据平板电视市场的竞争情况,把企业的产品布局归结为形象产品、英雄产品、份额产品、战斗产品四大类。形象产品主要是指能够提升整
在全球金融危机的影响下,订单减少、利润下降,企业管理者的本能反应就是压缩成本。殊不知压缩成本并不等于减薪、裁员,而是一场改革,关键在于兴利除弊。在名著《红楼梦》中,