属性序下的粗糙集与KNN相结合的英文文本分类研究

来源 :黑龙江大学自然科学学报 | 被引量 : 0次 | 上传用户:zyu03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于KNN(K Nearest Neighbor)文本分类器的待分类文本数据维数和计算次数较高,其耗费的时间和空间成本也很高,故引入粗糙集的属性约简算法对待分类的数据进行预处理。提出了基于属性序的处理方法和算法,解决粗糙集属性约简中的NP-hard问题。降低算法计算量从算法本身和运算技巧两个层面出发:在粗糙集区分矩阵的关键环节正区域计算上提出递减式计算方法,减少等价类的计算工作量;运用去停止词的查表法、位置信息在属性序中的引入及倒排索引的检索方法等来进一步降低系统的运行时间和空间成本。通过实验验证,经过粗
其他文献
摘要:以碱处理活化纤维素膜,经接枝置入环氧活性基团生成环氧化纤维素,再经亚氨基二乙酸(IDA)希夫碱反应、高碘酸钠氧化生成双醛氧化纤维素一IDA,金属离子螯合制备纤维素基金属螯合
喹啉是重要的化工原料,但其也带来严重的环境污染。采用富集培养的方法,从胜利油田石油污染土壤中筛选分离到1株喹啉高效降解菌Q5,初步鉴定为革兰氏阳性芽孢杆菌。在好氧条件
使用XRD和AES等分析手段以及微反评价装置,考察了过渡金属Fe的氧化物作为脱硫添加剂镁铝尖晶石的活性组分对脱硫活性的影响。结果表明,10% Ce/MgAI1.8Fe0.2O4·MgO具有良好
应用加速溶剂萃取(ASE)技术对食品中的油脂进行富集,经甲酯化反应后,通过HP-88毛细管色谱柱分离测定食品中反式脂肪酸含量。结果:在提取温度125℃,提取压力1500psi,以正己烷/二氯甲影
采用剪切界面粘度仪考察了大庆减压渣油超临界馏分(简称大庆减渣馏分)的油-水界面粘度.研究结果表明,大庆减渣馏分油-水界面粘度随馏分的增重、油相中馏分质量分数的增加以及
针对宝钢电镀锡机组原有监控系统的不足,提出了一种新的电镀锡机组监控解决方案。新系统在解决原有问题的同时增加了分析功能,包括趋势图显示、张力负荷分析、阳极板使用分析和
浙江大学首任校长马寅初次子马本初是我在浙江大学的学长,他1926年2月出生于北平,1948年浙大机械系毕业。作为中国人民抗日老战士,2015年共和国颁发给他“抗日战争胜利70周年纪
刘超,1919年出生于陕西省黄陵县阿党镇备村的一个官僚地主家庭,是封建地主家庭的叛逆。在他的生涯中,有着许多的传奇故事。在战争年代,他参加过国民党的青年组织“三青团”,以及军
伴随着融合媒体时代的到来,文化与旅游行业的不断深入融合,使得国家从政策层面上要求及支持有助于旅游信息化产业不断发展的相关项目,如何将旅游与文化产业相结合,同时利用融
To meet the demands of processing residue with high sulfur content, Fushun Research Institute of Petroleum and Petrochemicals (FRIPP) successfully developed the