基于数据挖掘技术的网络热门舆情分类研究

来源 :信息技术 | 被引量 : 0次 | 上传用户:wangtongqc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以提升网络热门舆情分类准确率,降低分类时间为目标,提出了基于数据挖掘技术的网络热门舆情分类方法.将小波核函数和支持向量机结合构成小波模糊支持向量机,采用增量学习机制和贝叶斯分类算法建立增量贝叶斯分类算法,组成小波模糊支持向量机-增量贝叶斯分类算法解决测试样本易分类失误以及类条件独立假定性很难获取问题,通过计算待测样本和小波支持向量机之间的距离,实现网络热门舆情分类.经实验验证:类置信度较高时,文中方法分类准确率高,运行时间少,可快速分类网络热门舆情,且网络热门舆情分类结果的查全率以及查准率都在94%以上,分类精度较好.
其他文献
文中通过对以词组为本的统计式机器翻译系统(Statistical machine translation system,SMT)进行词对应方法的优化和筛选来建立多语言机制的英语在线翻译辅助系统.通过M1模型来计算平行语料库中语言字与字之间可能的配对几率,以EM演算法求取未知资料状况下的参数最大值.通过设置条件值参数作为挑选对应句子的依据,采用双语新闻语料库进行实验对比.条件值参数在0.2至0.4之间为文中系统运作于平行语料库的最佳区间.
传统电网安全漏洞攻击图存在预测误差大、耗时长的问题,导致电网运行成本较高.为此,提出基于知识图谱的电网安全漏洞扩展攻击图研究方法.建立电网安全漏洞的挖掘关联规则与漏洞判断矩阵,获取出现安全漏洞概率最大的路径;追踪出现安全漏洞的异常数据来源;对电网安全漏洞处拓扑扫描与漏洞扫描,生成电网安全漏洞扩展攻击图.研究结果表明:在不同漏洞样本数、不同攻击路径的情况下,所提方法的安全漏洞定位误差较小、耗时较短,说明该方法的应用性较好.
为了打破跨语言交际中的语言障碍,采用翻译系统实现该目的.传统翻译系统不能很容易地处理单词和强调级别之间关系.此外,由于所有组件都是单独训练的,没有进行联合优化.为此,提出一种基于序列到序列模型的处理连续强调级别的方法,并将机器翻译和强调翻译结合到一个单一的模型中,这大大简化了翻译过程,更容易进行联合优化.实验表明,提出的模型与现有方法相比,具有更好的性能,并且能够较好地满足实际需求.
以提升运动员的训练效率和比赛成绩为目的,设计基于人工智能技术的运动员训练仿真模拟系统.系统包括感知交互子系统和模型演算子系统.其中感知交互子系统通过虚拟环境生产器构建三维训练场景后,通过模型演算子系统中的视图模块渲染三维场景中画面,同时其中逻辑模块计算运动员体能衰减,并将计算结果经接口传回至感知交互子系统效果产生器,呈现运动员训练的交互效果.经测试表明,该系统可有效完成运动员的体能衰减计算,并且承载性较好,可提升运动员的体能训练效果以及比赛仿真模拟效率,应用后可提升运动员比赛成绩.
针对现有系统地质灾害治理成本较高,不能有效划分地质灾害等级的问题,设计基于BIM与GIS融合设计的地质灾害治理系统.系统硬件由输入模块、运作模块和输出模块组成,通过各模块的共同作用,实现对地质灾害治理系统组织职能与岗位职权的设定.通过GIS的空间管理功能与BIM技术进行地质灾害数据动态采集与管理,实现不同属性数据之间的连接.利用OLE技术实现地质灾害评价与预测,根据评价结果给出治理措施.实验结果表明,所设计系统的经济成本较低,且能够对不同地区的地质灾害等级进行准确划分,具有较高的实际应用价值.