【摘 要】
:
及时、全面掌握网络舆情信息是当前各级地方政府要解决的一个关键问题。本文根据绵阳市政府舆情监测的实际需求,设计并实现了基于领域本体的舆情监测系统。
通过利用小
论文部分内容阅读
及时、全面掌握网络舆情信息是当前各级地方政府要解决的一个关键问题。本文根据绵阳市政府舆情监测的实际需求,设计并实现了基于领域本体的舆情监测系统。
通过利用小爬虫代替Nutch获取URL列表,提高了舆情源的采集速度,对于指定的舆情源可以在3小时完成一次完整扫描。提出了使用统计行块分布的方法提取新闻网页正文,使用模板的方式提取BBS网页正文,提高了网页信息抽取的速度和准确率。提出了一种快速的文档主题标引算法,综合考虑了词频、位置、词长、词性等因素,标引准确率达86%以上,算法时间复杂度为O(n)。利用《综合电子政务主题词表》构建了用于舆情监测的领域本体,并对本体做了有效扩展;提出了一种基于语义匹配的舆情信息发现算法,利用领域本体对词语进行语义扩展,使得舆情信息的发现更加全面、准确,准确率达91.2%。
实现了基于领域本体的网络舆情监测系统,该系统能对特定的舆情源实时进行舆情监测,能及时、全面发现政府所关注的舆情信息,并能在线实现网络舆情专报的编辑及报送。
其他文献
随着网络普及与发展,数字产品的共享变得越来越容易和频繁,多媒体作品的版权保护问题已经迫在眉睫,数字水印技术作为数字产品版权保护的主要手段,对其进行研究的必要性也越来
互联网的飞速发展在方便社会的同时,也带来了一系列的网络隐患。针对软件系统稳定性和安全性的问题,本文基于软件网络系统节点之间的调用关系、调用顺序以及内在的调用次数,
0-1背包问题是一种经典的NP难问题,目前还无法找到线性时间内求解该问题的算法,由于求解0-1背包问题在优化组合、资本预算、货物装载、削减库存以及信息密码学等领域具有极为重
目标跟踪是计算机视觉研究中的一个重要课题,它是目标行为理解的基础,是图像系统连续准确工作的重要部分。跟踪算法要求准确性和鲁棒性,在很多应用下还要求实时性,而现实中目
随着经济的快速发展和人们生活水平的不断提高,我国机动车的数量也在急速增多,机动车在给人们生活带来便利的同时,其造成的道路交通问题也日趋严重。因此,对于道路交通的管理急需
本文针对机器学习在视频水印中的应用进行了研究,主要是支持向量机与集成学习在其中的应用,首先通过对视频水印常遭受的攻击进行分类,然后根据每一类给出了应有的防范方法,重
设计模式是软件设计中典型问题的经典解决方式,但是其具体实现方式丰富多样。从源程序中识别出设计模式的实例,并提取出其语法和语义方面的详细信息,将对软件的理解和维护有很大
随着移动计算、普适计算和Web Service等新兴技术的迅速发展,尤其是在Internet成为主流的软件开发环境后,动态软件架构(DynamicSoftware Architecture,DSA)的研究已引起了研究者
聚类分析是智能信息处理、数据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有重要作用。大多数聚类算法都需要预先给出参数,如聚类数目、聚类中心
实际应用领域中产生了大量的数据流,例如电子商务交易记录,网络搜索请求,电信通话记录等,这些数据流中隐含着丰富的有价值的知识亟待挖掘。然而,由于数据流具有的快速性、无