一种基于容错粗糙集的Web文档分类方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：fly383910564

【摘要】

：

为了充分利用Web这一宝贵资源，需要一种高效准确的Web分类方法．应用机器学习技术，如K-邻近法、贝叶斯概率模型等已经实现了Web文档半自动和自动分类，但是，大多数Web分类方法共同的

【作者】

：

胡和平易高翔

【机构】

：

华中科技大学计算机科学与技术学院

【出处】

：

小型微型计算机系统

【发表日期】

：

2006年2期

【关键词】

：

WEB分类粗糙集容错粗糙集容错类 Web classification rough set tolerance rough set tolerance r

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了充分利用Web这一宝贵资源，需要一种高效准确的Web分类方法．应用机器学习技术，如K-邻近法、贝叶斯概率模型等已经实现了Web文档半自动和自动分类，但是，大多数Web分类方法共同的特点是把类作为互斥的概念，很少考虑类与类之间存在一定的交叉概念．其实，一个Web文档有时可属于几个类别，说明web文档的类之间存在不确定的关系．粗糙集理论-l982年Pawlak提出的，它在不确定关系表示有显著优点．由近似关系产生的分类方法分类精度更高．在web文档常用向量模型基础上，利用特征词协同出现的价值，本文采用一种广

其他文献

用Xerces—J进行基于XML Schema的XML局部验证

XML验证,特别是局部验证,是XML应用中的一个关键问题. 调研分析了Xerces-J2工具包中的基于XML Schema的XML解析、验证体系,它是一种延迟的整体验证.利用Xerces-J2,设计实现了

期刊

XMLSCHEMA局部验证类型检查ID约束检查XML Schema partial validation type checking identi

阿托伐他汀抑癌作用的研究进展

阿托伐他汀是一种3-羟基-3-甲基戊二酰辅酶A(3-hydroxyl-3-methylglutaric coenzyme A,HMG CoA)还原酶的选择性抑制剂,临床上主要用于降低血液中的胆固醇,减少心脑血管疾病的

期刊

阿托伐他汀肿瘤抑制药物治疗atorvastatintumorinhibitiondrug treatment

熵权系数法的理论建模分析与并行实现

在多指标综合评价经济效益问题的研究中,熵权系数法对于投资决策系统的综合评价起到了非常重要的作用.为了满足需要进行大量数据计算的经济效益多指标综合评价的应用需求,文

期刊

并行算法熵权系数法多指标综合评价parallel algorithm entropy weight coefficient method multicri

歪嘴哭综合征误诊1例

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

歪嘴哭综合症/诊断误诊

马岭油田延10油层组水淹层水驱渗流特征实验研究

应用真实砂岩微观模型对马岭油田延10低渗透储层进行微观水驱油渗流实验,并结合常规物性、铸体薄片、扫描电镜、毛管压力等多项测试方法,对不同含水率水淹层的岩石学、孔隙发

期刊

水驱油实验渗流特征孔隙结构马岭油田

用UML与Petri网为智能代理建模

统一建模型语言（UML）已经成为软件系统的分析与设计的标准工具，但由它扩充而成的代理统一建模型语言（AUML）还没变成一个标准，目前的AUML规格说明还有很多的局限性，还不能胜任多代理

期刊

PETRI网AUML智能代理系统开发Petri net AUML agent system development

青岛地铁2号线洗车机端刷故障研究与实践

青岛地铁2号线洗车机端刷故障频发。分析原因并采取改善措施,经过模拟和实车验证,降低设备故障率,提高端洗作业兑现率。

期刊

洗车机端刷电机限位开关可靠度

基于测量的接纳控制方案比较研究

基于测量的连接接纳控制(Measurement-based Connection Admission Control,MBCAC)通过实时的业务流测量从而对新连接请求做出接受与否的决定.MBCAC无须事先了解业务流的流量

期刊

基于连接的接纳控制流量模型有效带宽信元/分组丢失率可扩展性measurement-based connection admission control

格氏栲（Castanopsis Kawakamii Hayata）种群结构与动态规律研究

格氏栲是我国中亚热带南缘特有珍贵濒危植物，自然分布狭窄，象福建三明格氏栲保护区上千hm~2几乎纯林状态的格氏栲林实属国内外罕见。揭示格氏栲种群受危机制，已成为保护格氏栲的

学位

格氏栲种群结构动态数量分析

智能交通系统在交通运输管理中的运用

经济的快速发展促进了我国交通运输行业的蓬勃发展,因此要加强交通运输的管理工作。交通运输管理运用智能交通系统,势必会带来质的飞跃。基于此,本文分析了智能交通系统在交

期刊

交通运输城市拥堵智能交通系统运用

一种基于容错粗糙集的Web文档分类方法

与本文相关的学术论文