论文部分内容阅读
以世界主要国家权威网站上的实时新闻为研究对象,将语言学、信息科学、图书情报学的研究进行交叉融合,通过对每日互联网上产生的不同信息源,乃至不同语言源的最新海量新闻信息的研究分析,设计一套对新闻信息的智能收集、快速获取、去重去伪,并快速与该信息的背景资料进行有效整合的基础理论模型及其算法,从而找出实时新闻报道与用户兴趣点之间的联系,实现实时、按需推送的目标,并为解决大数据环境下海量信息实时处理的某些关键难点问题提供理论基础和验证。