一种基于N—Cram技术的中文文献自动分类方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:xiaozuzi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍一种基于n-gram技术的、与语言无关的文献分类方法K-means axiales (KMA),及其在中文文献自动分类中的应用。这种方法将文献转换成由n-gram(n个连续的字符)频次构成的向量。为压缩存储空间、提高处理速度,我们运用哈希函数将n-gram映射为哈希码,对文献的分析实际上以哈希码频次为基础运尾。采用KMA算法,我们对一个中文数据库进行了自动分类的实验研究,在比较实验结果的基础上,我们对KMA算法初始参数的选择进行了初步探讨。
其他文献
时代在发展,教育在发展,我们作为一名班主任教师必须与时俱进。“问渠那得清如许,为有源头活水来。”我们要做学生的榜样。我们班主任是学生的引路人,又是学生成长路上的导师,学生
根据当前公众满意度测评的特点,本文引入基于期望值的模糊多属性决策方法进行政府门户网站的满意度测评研究。考虑到政府门户网站开展满意度评价的实际情况,文中采用三角模糊数
本文以Internet发展为背景,分前网络时期和网络时期两个阶段对IA进行了考察,提出了狭义IA(书本IA、网站IA)和广义IA,并对其含义、内容和作用进行了探讨和论述.
1 病例介绍 患者男, 59岁,因口渴、多饮、多尿、消瘦 8年,伴手足麻木,视物模糊 2年,于 2005年 1月 5日入院,测 T 36.5℃, P 86次 /分, R 20次 /分, BP 140/70 mmHg,随机指血
使用Matlab开发平台设计了一个区域生长算法以用于肺的CT图像的分割。试验结果表明,区域生长算法能较好地将肺实质区域分割出来,满足进行下一步肺结节检测的需要。
小学数学应用题教学已成为关键,经过深入小学数学教学,发现应用题是小学数学的一道难题,面对繁多抽象的应用题,学困生总是“头痛不已”。长期看来,小学数学教师对于应用题教学总是
本文在介绍超文本系统概念的基础上,分析了超文本研究中的有关问题,着重分析了超文本系统所面临的博物馆现象(即迷航问题),指出了超文本迷航的几个原因,基于当前解决迷航问题
对于一些会计科目的入账金额处理方法比较复杂,本文拟通过一些简洁可行的处理方法,结合实例进行讲解,使之更具操作性和使用性。
[摘要]目的 探讨胎膜早破与早产的相关性。方法 对2006年1月~2008年6月我院产科早产分娩130例,抽取在本院同期足月分娩130例产妇作对照,比较两组产妇的相关情况及围产儿结局。结果 生存率:早产儿87.69%,足月儿达99.23%,有显著性差异;PROM发生率:早产组22.31%,足月产组9.23%,早产组明显高于足月产组,均有显著性差异。结论 胎膜早破与早产呈正相关,积极治疗妊娠期生殖道
“您”作为祈使句主语系统中最高层次的标记项呈现出丰富的种种语法表现:对祈使句肯定式的制约主要表现为祈请事象常具有听者[+受惠]特征;对强调式的制约主要表现在对强调标