多层次web文本分类

来源 :情报学报 | 被引量 : 0次 | 上传用户:best0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的文本分类大多基于向量空间,分类体系为甲面体系,忽视了类别间的层次关系.根据LSA理论提出了一种多层次web文本分类方法.建立类模型时,根据类别的层次关系树由下到上逐层为具有相同父节点的类别建立一个类模型;分类时,由上到下,根据相应的类模型存LS空间上分类.这种分类方法解决了LSA模型中高维矩阵难以进行奇异值分解的问题.同时体现了web文本中词条的语义关系,注重了词条在网页中的表现形式.实验表明,多层次web文本分类方法比基于平面分类体系的分类方法在查全率和准确率方面要好.
其他文献
MEMS Si计时设备领域的领衔企业SiTime最新推出了业界尺寸最小的低周期到周期抖动宽频可编程扩频振荡器系列产品。首款高性能产品包括SiT9001和SiT9002。SiT9001在业界空间占
作者通过对数字图书馆用户满意度的影响因素的分析,构建了数字图书馆用户满意度模型,并利用该模型对某大学的用户满意度水平进行了测定,提出了关于该大学图书馆需要改进之处的建
本文以史实为基础,将上海普通高中名校的发展,划分为三个阶段:一是中西合璧的生成阶段,二是重点校政策拉动和改革驱动的成长阶段,三是以示范性高中建设为中心的内涵发展阶段
随着我国经济的不断发展,传统的农耕经济带来的收入已经完全不能满足的人们的需求。人们为了追求更多的经济收入,往往会选择去不同的城市去发展。这种现象在农村尤其突出,大量的
<正>新的历史条件和环境下,深入推进"四个全面",必须重新完善人民调解制度,使之在法治中国建设中发挥不可或缺的积极作用。人民调解制度改革,重在进行顶层设计,有针对性地解
讨论了Ⅲ族氮化物HFET中电流崩塌和沟道内二维电子气特性间的关联,提出了描述产生电流崩塌时电子动态运动的微观模型.栅延迟电流崩塌被归因于栅-漏电极间隙中表面态与其下沟
目的:探究四川泸州地区口腔扁平苔藓(OLP)致病危险因素。方法:纳入至西南医科大学附属口腔医院就诊的OLP患者(病例组,n=171)及同期的口腔黏膜健康者(对照组,n=165)进行22个变
目的:探讨肥大细胞(mast cell,MC)在口腔黏膜良性淋巴组织增生病(benign lymphoadenosis of oral mucosa,BLOM)中的表达及与临床病理关系。方法:甲苯胺蓝组织化学和免疫组化
在文献调研的基础上,分析了二氧化钛的光催化过程,结果表明,二氧化钛颗粒受紫外光激发,产生的电子和空穴与表面氧和水反应,形成具有强氧化作用的活性自由基,催化降解有机质。
央企整合再有新进展,3月19日,中国核建发布公告称,公司收到控股股东中国核工业建设集团公司发来的通知,获悉中国核工业建设集团与中国核工业集团正在筹划战略重组事宜,重组方案尚