浅谈基于粗集理论的文本归类系统

来源 :河北工业科技 | 被引量 : 0次 | 上传用户:yjqwml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算法产生最终分类的规则表,利用产生的规则表,可将林业文本信息数据进行自动归类。
其他文献
目的探讨脐血瘦素、IGF—Ⅰ和脂联素与胎儿宫内生长迟缓的关系。方法选择2006年10月至2007年10月在我院新生儿47例,宫内生长迟缓(小于胎龄儿,SGA)组16例,适于胎龄儿(AGA)组31例为正
从实验设计的发展历史开始简单介绍了3种不同的实验设计方法——经典实验设计、田口方法和谢宁方法,并以实例详细介绍了谢宁实验方法的具体应用。
建立了基团电负性和直链烷基甲碳原子个数计算直链有机物的标准汽化热的简单方法,共计算出126个各类直链有机物的标准汽化热数值,并与已知的66个文献值比较,数据一致性良好,其平
目的分析阿拉善盟2008年-2010年肺结核病流行病学特征,探讨预防控制策略。方法对2008-2010年肺结核病的发病情况和疫情资料进行描述性流行病学分析。结果 2008-2010年累计发
近日,中国首台8000t双柱快速自由锻造液压机在中钢邢机厂热试车成功。这标志着中钢邢机厂两年多的技改计划已全部完成,它使中钢邢机厂在世界同行业中具备了至少20年内不落后的
目的分析柳铁地区食品、公共场所、学幼、饮水从业人员健康状况。方法选取柳州铁路地区辖区内从事食品、公共场所、学幼、饮水工作的按法规须体检的从业人员检病毒性肝炎、痢
肺结核病是锡林浩特市重点防治的传染病之一。2005年前肺结核报告发病率一直呈持续上升态势,自2004年实施结核病控制项目以来,持续上升的势头得到遏制。现根据锡林浩特市2006
目的研究急性脑梗死患者与脂蛋白a水平的关系。方法选择本院2010年8月~12月急性脑梗死住院患者65例为病例组和健康体检者53例为对照组,并检测两组患者血压、血糖、甘油三酯(TG)、
目的检测胎盘组织中缺氧诱导因子-1和基质金属蛋白酶-8的表达,探讨其与妊娠期高血压疾病发病的关系。方法用荧光定量PCR法检测20例妊娠期高血压疾病患者及20例正常妊娠者胎盘
介绍了无线传感器网络中常用的路由协议,指出这些路由协议在设计时并不是以安全性为主要目标,无线传感器网络的特性使它面临着比传统网络具有更大的不安全性。分析了这些协议中