论文部分内容阅读
基于短文本的事件探测技术,成为学术研究领域的热点问题。而微博数据是短文本事件探测的典型数据源,含有丰富的人们日常生活信息。近年来,以食源性疾病为代表的食品安全问题备受人们的关注,常成为微博热点。基于微博数据的食源性疾病事件探测主要包括发现食源性疾病事件和食源性疾病事件时空信息。但是由于微博内容的多样性、稀疏性和碎片性,现有的事件探测方法使用的数据源单一且噪声较大,在时空信息的发现上粒度过大导致结果的准确性差。本文在事件探测算法上,提出动态上下文窗口算法构建候选微博来进行事件探测,提高了事件探测的效率和精度。并提出利用微博内容发现特定事件地理位置信息的算法,提高了事件时空信息的获取精度。最后应用于食源性疾病事件的自动探测中,较之以往的事件探测方法,扩大了数据来源,且时间和空间维度上的准确性得到显著提高。