结合中文分词的贝叶斯文本分类

来源 :苏州市职业大学学报 | 被引量 : 0次 | 上传用户:zhouwg_zhouwg_zho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是组织大规模文档数据的基础和核心。朴素贝叶斯文本分类方法是种简单且有效的文本分类算法,但是属性间强独立性的假设在现实中并不成立,借鉴概率论中的多项式模型,结合中文分词过程,引入特征词条权重,给出了改进Bayes方法。并由实验验证和应用本方法,文本分类的效率得到了提高。
其他文献
目的:观察地龙水煎剂对未孕大鼠离体子宫平滑肌运动的影响,并初步探讨其作用机制。方法:运用BL一420生物信号系统记录离体大鼠子宫平滑肌每的活动,观察不同剂量地龙水煎荆对子宫
网络工程建设研究性课程与传统的课堂教学模式不同,采用工程项目的组织方式进行团队式的学习,在项目实施过程中培养学生在工程建设上的各项技能.课程的组织规划、实施以及人员的
香港首富李嘉诚被称为“世界经济强人”、“全球超级巨富”。他是怎样对待金钱的呢?他认为钱从社会中来。就应该回到社会中去,决不能嗜钱如命,不能“拔一毛利天下而弗为”。一个
人力资源是经济社会的第一资源,高校对合理配置人力资源,促进高等教育发展起着重要的作用。高校现行人事管理体制存在着理念落后、工作被动等问题,考虑到高校人力资源的特殊性,宜
通过调查访谈,我们发现基层政治主官不仅在工作、生活中会遇到与其他官兵一样的问题,如家庭的拖累、工作的烦恼、情绪的波动、心境的紊乱、自尊的挫伤、身心的失调等,而且其角色
介绍了放大电路中反馈的分类及各种反馈类型的判断方法,举例说明根据电路的要求选择合适的反馈类型及判断电路能否产生振荡.
1949年,国民党迁台后,将当时的台湾划为5个省辖市、16个县、一个管理局。1967年、1979年先后将台北、高雄升格为“直辖市”。1982年又分别从新竹、嘉义两县分立出新竹、嘉义两
基于模糊理论对城市电网供电能力进行评估时,需要解决的两个关键问题:一是建立模糊评估隶属函数,二是因各因素的影响程度不同,需确定其权重。介绍了隶属度函数确定的基本方法;并用
以培养工科大学生科研创新能力为落脚点,提出了工科大学生科研创新能力培养的模式,有助于实现第一课堂和第二课堂较好地融合,努力培养创新人才,以应对未来社会的竞争.
认知调控法。心理学上有句老话说得好,“困扰我们的不是事件本身,而是我们对事件的看法”,很多心理问题就是源于认知障碍。认知调控方法就是当个人出现不适度、不合理的思维和情