一种改进的文本网页分类特征选择方法

来源 :计算机应用 | 被引量 : 7次 | 上传用户:liner1018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本网页数据集分类实验中 ,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针”系统大规模文本网页分类中
其他文献
应用番茄早疫病菌Alternaria Solani(E·et·M)Joned et Grout·]分生孢子室内水滴培养,探讨了分生孢子的萌发与温度、湿度、酸碱度、光照等的关系,并测定了几种杀菌剂对分生孢子萌发的抑制作用。
玉米弯霉叶斑病菌生长的温度范围是9-38℃,pH值为3-10,最适温度为30℃,最适PH为7;孢子产生的温度是15-38℃,最适温度为30℃,相对湿度为98%以上。
文章对基于Internet的虚拟EDA实验室系统进行了面向对象的分析,论述了系统管理软件的设计与实现。由于EDA实验室中的服务器和客户端传送的信息、数据种类较多,因此本文还规定了一套三者之间通信的协议。
在会话初始协议(SIP)和一般网络会议模型的基础上,设计了一种用于域间会议的双层SIP网络会议管理系统,并给出了其功能实现。还提出了一个新的SIP协议扩展方案。
在研究SR-tree(Sphere/Rectangle-tree)和X-tree(eXtendednodetree)的结构与性能的基础上,针对SR-tree分裂算法的不足,改进了分裂算法,结合两者的优点,设计了一种新的多维索引结构ESR-tree(ExtendedSR-tree)。实验表明,随着数据量和维数的增多,ESR-tree的性能要优于SR-tree和X-tree。
文中针对一种特殊的语言现象(HNC称为包装句蜕)进行了分析,目的是为机器翻译提供一些理论支持。首先从目前机器翻译系统所暴露的问题中提出研究包装句蜕的必要性,然后是对包装句蜕进行语言学描述及汉英对比分析,从可计算的角度提出了包装句蜕的判别方法,最后是包装句蜕的机器处理策略及规则。
根据修正的Hellinger-Reissuer原理,用理性方法,建立了一个无外力圆形表面的三维12节点杂交应力元。通过数值算例结果表明,用该元计算所得应力集中因子,环向应力σ_θ及轴向
百农64干物重增长呈S曲线,抽穗前干物质分配以茎叶等营养器官为中心,抽穗后以穗子为中心。在栽培管理上,要施足基肥,前期适时追肥保证营养器官的顺利建成,抽穗前后适时适量追肥,可延长
患者,冉X,女,3岁,1991年6月24日由其母主诉:半月前因发现女儿外阴部红肿,并有粘稠脓性分泌物特来就诊。体检,患儿发育中等、体温正常,阴部有大量黄绿色脓性分泌物覆盖阴道、
系统介绍了RFLP的概念、原理、特点及其在实验操作中应注意的事项,总结了RFLP技术用于玉米、水稻等作物的基因定位以及在育种上的研究成果,最后讨论了RFLP技术在实践应用中存在