可分性判据在中文网页分类中的应用

来源 :微处理机 | 被引量 : 0次 | 上传用户:xuan1911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种改进的基于统计的中文网页的分类算法,通过对传统的基于计算相似度文本分类方法和基于贝叶斯模型文本分类算法的研究,我们对贝叶斯模型分类算法进行了改进,提出了利用一种基于概率分布的可分性判据分类方法,即用类别密度函数似然比来增加特征词的可分性信息的算法.通过对计算相似度方法、贝叶斯方法及改进的贝叶斯方法的对比实验表明,改进算法可以使类与类的间隔最大化,因而具有较高的分类精确率和召回率.
其他文献
小波去噪算法的关键是如何处理小波变换系数。把电路中同或的思想引入图像去噪领域,在识别信噪属性时,综合考虑了小波系数的模极大值、相位等因素,提出了小波域同或去噪算法。较之经典方法,此方法在改善去噪效果的同时提高了算法的执行速度。
针对海上多平台联合系统探测的作战要求,论述海上联合探测资源适应性优化配置技术和海上联合探测综合信号系统处理技术。提出了基于信息获取和系统抗干扰能力、反隐身能力和
首先介绍了基于Windows2000/XP的设备驱动程序WDM的基本组成和原理,然后探讨了如何使用DDK实现访问PCI设备配置空间、物理内存和I/O端口及实现中断服务程序,最后选用SOFTICE
一、研究动画民族化教学模式的意义发展动漫产业对于推动民族文化产业发展和培育新的经济增长点具有重要意义。然而,要在我国大力发展动漫产业,必须要建立合理的发展结构和布
在研究了4.567kb/s ACELP的语音压缩编码算法基础上,通过分析其原理及其基本特征,在实际应用中提出了优化算法,原算法和优化后的算法分别用C语言仿真实现,发现优化后的算法提高了语
中国老龄化问题日益严重,用户结构从年轻人向长者蔓延,但目前市面上几乎没有针对长者友善的网站设计。"乐乐活大家讲"是一专为长者设计的线上调查网站,网站提供辅助长者操作