Bayes文本分类器的改进方法研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:yetigai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类领域,Bayes分类器是一种常用且效果较好的、基于概率的分类器,具有较严密的理论基础。该文对朴素Bayes文本分类器进行了分析,提出了利用权值调整机制改善其分类性能的方法,以及在缺乏大量训练文本的情况下,利用EM算法进行非监督Bayes分类的方法,并讨论了如何运用启发式方法确定Bayes网络结构,在更贴近真实环境的情况下进行文本分类。
其他文献
采用接触氧化—水解 (酸化 )—两段接触氧化—混凝工艺处理高浓度养猪场废水 ,通过试验得到最佳工艺参数。在最佳试验条件下 ,进水 CODcr小于 50 0 0 mg/L,经处理后出水 CODc
针对云计算的变革,文章分析云计算发展的几大趋势,阐述适应云计算的关键是要提供高弹性、高扩展性、易管理和开放的网络,并建议未来理想的云计算网络架构应是一个无阻塞、可
我国是多山地国家,自然资源丰富,文化历史传承悠久,发展登山旅游具有丰富的自然资源优势和深厚的人文背景。在当前时期,要从挖掘、开发登山旅游资源出发,积极实施有针对性的
客服系统目前面临着成本高、维护难的问题。文章采用桌面虚拟化(Virtual Desktop Infrastructure,VDI)技术,提出了客服系统虚拟化的技术方案及实施策略,该方案将不同桌面用户
当前我国登山商业活动日趋活跃,登山体育产业链条已经形成,其相关服务项目基本完善,很多服务企业赢得了广大消费者的认可,已经构建起了登山体育服务企业多元营销平台,然而我
当前,抗生素的耐药性及内源感染等问题使人们将更多注意力集中在寻找残留少、污染小的饲料添加剂,益生素作为其中之一,其生理功能及作用机理成为世界各国相关行业的研究热点。益
目的总结老年高血压患者的临床特征。方法对比分析两组高血压患者的临床资料及相关的信息,以老年组100例高血压患者的血压情况、临床表现、X线及心电图检查情况、并发症发生
分析了汉语新词在英译过程中存在的问题:一是未将汉语新词中的"隐含成分"表达出来就落笔翻译;二是不能摆脱中文字面的束缚,中式英语层出不穷;三是不能把中西文化融会贯通,忽
改革开放以来,我国义务教育阶段学生择校入学的制度安排经历了由"不作规定"到只提倡"就近入学",再到"就近入学""与"择校"两种制度并存,到如今只提出"就近入学"的变迁过程。近
介绍了焊接机器人离线编程系统的组成,分析了路径规划的实用功能;搭建了双机器人工作站仿真场景,采用单点法,先在现场标定工作平台的实际位置,然后在仿真场景中进行校准;利用