基于进化模糊规则的Web新闻文本挖掘与分类方法

来源 :湘潭大学自然科学学报 | 被引量 : 0次 | 上传用户:bai1988ping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.
其他文献
政治建设和思想建设是党的建设的两个重要组成部分,始终坚持政治建设与思想建设相结合是中国共产党在革命、建设、改革过程中所形成的优良传统与鲜明特色。面对不同时代不同的历史任务,中国共产党的政治建设与思想建设强调的内容、发挥的作用有所不同,但两者之间始终是不可分割、相互承接的辩证统一关系。政治建设是党的根本性建设,决定思想建设的方向和效果;思想建设是党的基础性建设,是夯实政治建设的基础;同时,两者又不可
论文以金华市婺城区金华四中、金华第十四中学、北苑小学和北山路小学四所具有鲜明城乡特点的学校作为研究对象,以该市四所学校学生课外培训消费为研究内容,通过自编的调查问
为了解决排球视频中运动员重叠事件影响目标跟踪精度的问题,提出一种基于改进型粒子滤波的跟踪方法.首先,为每个跟踪目标标记一个不同颜色的标签,以此来检测重叠事件的发生,同时利用粒子滤波来跟踪目标.然后,当重叠事件发生时,根据目标的颜色似然度和距离似然度计算综合似然度,以此来避免粒子聚集到一个目标上.最后,根据位置预测模型来预测目标位置,实现目标的实时跟踪.实验结果表明,提出的方法能够对重叠事件具有鲁棒
当今世界洪水灾害发生频繁且强度大,由于财富的日趋集中,洪水灾害造成的经济损失也越来越大。把洪水灾害纳入到商业保险,做大做强洪水保险是未来洪水风险管理的必然趋势,也是
闽南话对英语词的借用过程,主要可分为接触、接纳与接续三阶段,分别呈现出借用的动机及倾向、传入途径与借用方式以及借词后续的竞争与演变,完整勾勒出其动态的借用机制。在
随着计算机网络和通讯技术的迅速发展,特别是互联网的普及应用,使得传统的贸易方式发生了巨大变化,电子商务在我国呈现出迅速发展的趋势。传统的零售业也搬到了网络上经营。
期刊
期刊
基于问卷调查结果的分析表明:新冠肺炎疫情对人们的旅游信心影响不一,大部分被调查者的旅游信心恢复期在1个月以上;疫情后人们将更加重视旅游目的地的环境安全,更加重视人与
期刊