基于多项式分布模型的Web文本分类

来源 :华北电力大学学报 | 被引量 : 0次 | 上传用户:misariza
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用信息增益函数对文档进行特征提取,根据特征在文档中出现的次数,将文档表示成为向量的形式.假设文档的特征之间是相互独立的,其特征和主题类别的联合概率分布为服从多项式分布.利用训练集中已标注的文档、学习特征和主题类别的联合概率分布参数,根据学习的结果,对测试集中未分类的文档进行分类.实验结果表明,分类具有较高的准确性.
其他文献
意大利Tecnologie Urbane公司目前已设计出一种全塑折叠自行车,该自行车轻便,易携带。
在当前计算机技术的速发展时期,信息网络已经成为社会发展的重要保证。本文对计算机网络及信息安全进行了概述,主要论述了影响网络信息安全的主要因素,并从技术方面和非技术方面
随着经济的快速发展,网络通讯技术已经深入到人们工作和生活当中。同时,网络通讯还有一些弊端,比如:个人隐私被窃取、泄露等资源被非法利用。这是由于计算机软硬件问题而造成通讯
<正>~~
加强职业教育立法、构建完善的职业教育法律体系,是推进职业教育事业健康发展的基石。1996年颁布实施的《中华人民共和国职业教育法》(以下简称《职教法》),是我国职业教育发
随着科学技术的发展,为提高企业的经营效益,信息化已经引入到各行各业中。信息化建设也是医院适应现代化发展的必然要求。医院的财务管理是医院管理的重要内容,如何加强财务管理
无线局域网是随着无线通信技术的快速发展而出现的一种新型网络。本文介绍了无线局域网的涵义、基本组成、标准,探讨了无线局域网的技术实现和具体应用。
档案信息化建设是档案事业面对全球信息化浪潮的必然选择。本文主要针对电子信息环境下的档案信息化建设进行了简单分析和探讨。
本文分析了网络存在的安全威胁问题,阐述了计算机网络系统安全发展方向,介绍了保护计算机陬络安全方法,提出了计算机网络系统安全策略。
会场变考场,开会变考试。这是重庆市奉节县人大常委会主任李晓华培养干部的惯有方法,他认为,这种考试方法可以提高干部,特别是年轻干部的应变能力和写作水平,促使他们养成不