论文部分内容阅读
随着计算机的普及,网络进入了高速发展的阶段,逐步成为了人们生活中的一部分。人们获取信息的方式也逐渐从广播、电视、报纸转移到了网络。通过网络社区,民众可以表达情绪、态度、意见、要求,这样众多舆论的汇总形成了网络社区的舆情,网络已经成为舆论活动的主要阵地。目前采用人工发布信息的手段来对网络社区进行舆情的引导,需要大量的人力物力,已经不能够满足现实的需要。因此网络舆情引导,已经成为了学术界研究的热点。论文从网络舆情引导中用到的技术角度出发,提出了针对网络社区舆情引导的技术解决方案,设计了一个舆情引导系统。论文中,将对网络社区舆情引导中涉及到的主要关键技术:多通道信息采集、话语复述及网络社区信息自动发布展开详细的讨论。首先,多通道信息采集部分针对不同类型的网站进行信息采集,分为四个采集通道:主流媒体网站通道、博客通道、论坛BBS通道以及微博通道。前三个在尽量保证底层爬虫架构不变动的情况下,通过配置不同的通道,达到信息采集的目的。微博通道则单独采用了开放API的接口来采集信息,保证了程序的稳定性。其次,文中利用同义词替换方法。先将在网络上抓取的语料进行分词,然后利用同义词词库,对分词后的语料进行同义词替换,得到意思相同的句子,构成新的语料库。再次,论文针对两类网络社区:论坛和微博,进行信息的自动发布。研究和实现了Windows平台下的网络社区信息发布系统,系统实现中采用了基于神经网络识别的图形验证码技术,利用WebBrowser控件解决了论坛的信息自动发布,利用微博开放API解决了微博的信息自动发布。最后,通过对系统的测试,根据研究结论所得出的方案,在一定程度上可以解决网络社区舆情引导的问题,具有一定的可行性,系统有一定的应用价值。