论文部分内容阅读
网络灰色信息多属于互联网上离散分布的半公开化潜在数据资源,通过总结网络灰色信息的价值性与综合特征可知,依靠常规搜索引擎较难获得可用性高的灰色信息资源集。为获取更宽泛的网络灰色信息存在轨迹,提出了以广度优先搜索为主的信息爬取技术架构并建立索引数据库,在此基础上,将语义相似度与置信度约束融入主题关联二次搜索,以获得理想挖掘结果;网络信息流强度概念的引入,揭示出网络媒体资源对社会决策的影响程度,并在股票涨跌幅与网络关注度的关联实例中得到验证。