论文部分内容阅读
在美国,食源性疾病是个顽固的祸害,每六个美国人当中就有一人正在受影响。
食源性疾病是指通过摄食而进入人体的有毒有害物质(包括生物性病原体)等致病因子所造成的疾病。一般可分为感染性和中毒性,包括常见的食物中毒、肠道传染病、人畜共患传染病、寄生虫病以及化学性有毒有害物质所引起的疾病。
疾病控制和预防中心(CDC)一直在不知疲倦地了解疾病的发展趋势。美国食品和药物管理局(FDA)也已经绘制出了与疾病相关危险因素的清晰图表。
建立一个大规模的数据库
从流行病学的角度看,这些信息是不错的,但不是最好的。大多数这些报告所依据的数据都来自急诊室,只记录了前去就医的人当中出现腹泻、呕吐、胃痛、发烧或器官功能障碍等症状的人数。这些虽然有助于建立一个大规模的数据库、掌握整体态势,但在个体层面,相关数据经常是稀缺的,无法满足需求。对于流行病学家来说,如果要更准确地掌握疫情,他们必须明确每个个体出现症状前后的经历。不幸的是,这些通常未被报道或记录。
美国疾控中心一直在努力寻找新途径以解决个人信息不完善问题,他们希望找到一种最好的方法,既能完整地收集数据,同时又能保护个人隐私。早在1999年的一份报告中就阐明了获得数据在调查食源性疫情中的重要性。然而,时至今日所需数据依然是严重缺失的。一些研究人员也在尝试用别的方式在匿名的情况下获取信息。其中一个例子是2004年的RUsick2论坛利用互联网来从访客那里收集数据。该程序聚焦于有关症状的信息而非引起疾病的微生物。识别引发疾病的微生物是个艰难而细致的过程,而记录个体的感觉则同样复杂。RUsick2程序的结果很好,但受限于个人必须决定坐下来并进行注册。
虽然RUsick2可能并不完美,但它的尝试为之后利用社交网站寻求改善食品安全的可行性方法设定了基线。一些旨在更好地理解健康问题的新方法随后陆续接受测试,重点都是看看它们驾驭信息的能力。例如,2008年BioCaster网站试图通过分析网上媒体文章以确定疫情。此外,丰富站点摘要(RSS)也为食源性疫情研究者提供了大量的、公开的信息,而且可以通过关键词检索。这些关键词可以非常简单:病毒、疾病、暴发、发烧、感染、损伤、风险、病。当信息聚合并结合地理空间分析后,就可以确定感染的潜在热点。
大数据需要和人的联系
到了2010年,大量数字疾病映射资源已经陆续出现,例如谷歌趋势(Google Trends)、健康地图(HealthMap)和ProMED邮件等。它们都在扮演着同样的角色,即提供有新闻价值的文章,帮助追踪疫情暴发地或哪些地方存在暴发疫情的可能性。这些分析结果对疾控中心和世界卫生组织来说价值巨大,有助于缩短反应时间,及时采取干预措施。
然而仍有一个因素是缺失的:个人。
虽然新闻为研究者和公民个人提供了一些联系,但它也仅仅是收集一些信息而已。几乎没有食源性疾病或其他温和疾病个例出现在新闻头条。因此必须寻找更好的个人信息收集途径,但同时也不会干扰到个人的正常生活。
今年6月,美国纽约市的一个研究团队找到了前进的方向。但是,他们无法单独做到这一点,他们需要Yelp的帮助。
Yelp是一个为美国人提供在线点评服务的网站,尤其是点评餐厅(类似中国的“大众点评”网)。在过去十年里,这个网站累积了超过1.32亿名粉丝,每月发表的评论超过5700万条。这是一种免费服务,意味着任何人都可以加入。而对科学团队来说,这是一个实现其想法的完美网站。
社交媒体的力量
Yelpidemiology的流程非常简单。纽约市的这个研究团队查看了Yelp网站过去9个月中大约29.4万条评论,统计了那些可能与食源性感染相关的单词和短语。虽然他们的研究是广泛而没有预设目标的,但令人惊讶的是他们发现了893条符合食源性疾病的评论。通过进一步调查,他们发现其中499例是真正的感染事件,但公共卫生部门只记录了15例。
在掌握了这些数据后,该研究团队希望利用这些信息追溯病源。他们联系了其中的27人,详细询问了他们出现症状前后的经历,然后确定了24家餐厅为食源性疾病的来源,另有3人的情况难以确定。虽然目前的数据还比较有限,但已经能够证明Yelpidemiology的效果和价值。
毫无疑问,社交媒体的力量将继续帮助公共卫生官员提高迅速识别和应对疫情的能力。因为社交媒体是公共的,其用户个人在发表信息的时候也已经确定了哪些信息是可以公开的,因此不会涉及到个人隐私问题。
对于疾控中心和其他研究者来说,Yelpidemiology进行的试验性分析,为今后的食源性疾病研究和应对提供了明确的前进路线,可能会因此而衍生出更强大的信息聚合和分析技术。而对于普通美国人来说,这可能意味着某一天人们能够在去新餐厅尝试美食之前先通过Yelp或其他网站了解其是否存在医疗卫生风险。
食源性疾病是指通过摄食而进入人体的有毒有害物质(包括生物性病原体)等致病因子所造成的疾病。一般可分为感染性和中毒性,包括常见的食物中毒、肠道传染病、人畜共患传染病、寄生虫病以及化学性有毒有害物质所引起的疾病。
疾病控制和预防中心(CDC)一直在不知疲倦地了解疾病的发展趋势。美国食品和药物管理局(FDA)也已经绘制出了与疾病相关危险因素的清晰图表。
建立一个大规模的数据库
从流行病学的角度看,这些信息是不错的,但不是最好的。大多数这些报告所依据的数据都来自急诊室,只记录了前去就医的人当中出现腹泻、呕吐、胃痛、发烧或器官功能障碍等症状的人数。这些虽然有助于建立一个大规模的数据库、掌握整体态势,但在个体层面,相关数据经常是稀缺的,无法满足需求。对于流行病学家来说,如果要更准确地掌握疫情,他们必须明确每个个体出现症状前后的经历。不幸的是,这些通常未被报道或记录。
美国疾控中心一直在努力寻找新途径以解决个人信息不完善问题,他们希望找到一种最好的方法,既能完整地收集数据,同时又能保护个人隐私。早在1999年的一份报告中就阐明了获得数据在调查食源性疫情中的重要性。然而,时至今日所需数据依然是严重缺失的。一些研究人员也在尝试用别的方式在匿名的情况下获取信息。其中一个例子是2004年的RUsick2论坛利用互联网来从访客那里收集数据。该程序聚焦于有关症状的信息而非引起疾病的微生物。识别引发疾病的微生物是个艰难而细致的过程,而记录个体的感觉则同样复杂。RUsick2程序的结果很好,但受限于个人必须决定坐下来并进行注册。
虽然RUsick2可能并不完美,但它的尝试为之后利用社交网站寻求改善食品安全的可行性方法设定了基线。一些旨在更好地理解健康问题的新方法随后陆续接受测试,重点都是看看它们驾驭信息的能力。例如,2008年BioCaster网站试图通过分析网上媒体文章以确定疫情。此外,丰富站点摘要(RSS)也为食源性疫情研究者提供了大量的、公开的信息,而且可以通过关键词检索。这些关键词可以非常简单:病毒、疾病、暴发、发烧、感染、损伤、风险、病。当信息聚合并结合地理空间分析后,就可以确定感染的潜在热点。
大数据需要和人的联系
到了2010年,大量数字疾病映射资源已经陆续出现,例如谷歌趋势(Google Trends)、健康地图(HealthMap)和ProMED邮件等。它们都在扮演着同样的角色,即提供有新闻价值的文章,帮助追踪疫情暴发地或哪些地方存在暴发疫情的可能性。这些分析结果对疾控中心和世界卫生组织来说价值巨大,有助于缩短反应时间,及时采取干预措施。
然而仍有一个因素是缺失的:个人。
虽然新闻为研究者和公民个人提供了一些联系,但它也仅仅是收集一些信息而已。几乎没有食源性疾病或其他温和疾病个例出现在新闻头条。因此必须寻找更好的个人信息收集途径,但同时也不会干扰到个人的正常生活。
今年6月,美国纽约市的一个研究团队找到了前进的方向。但是,他们无法单独做到这一点,他们需要Yelp的帮助。
Yelp是一个为美国人提供在线点评服务的网站,尤其是点评餐厅(类似中国的“大众点评”网)。在过去十年里,这个网站累积了超过1.32亿名粉丝,每月发表的评论超过5700万条。这是一种免费服务,意味着任何人都可以加入。而对科学团队来说,这是一个实现其想法的完美网站。
社交媒体的力量
Yelpidemiology的流程非常简单。纽约市的这个研究团队查看了Yelp网站过去9个月中大约29.4万条评论,统计了那些可能与食源性感染相关的单词和短语。虽然他们的研究是广泛而没有预设目标的,但令人惊讶的是他们发现了893条符合食源性疾病的评论。通过进一步调查,他们发现其中499例是真正的感染事件,但公共卫生部门只记录了15例。
在掌握了这些数据后,该研究团队希望利用这些信息追溯病源。他们联系了其中的27人,详细询问了他们出现症状前后的经历,然后确定了24家餐厅为食源性疾病的来源,另有3人的情况难以确定。虽然目前的数据还比较有限,但已经能够证明Yelpidemiology的效果和价值。
毫无疑问,社交媒体的力量将继续帮助公共卫生官员提高迅速识别和应对疫情的能力。因为社交媒体是公共的,其用户个人在发表信息的时候也已经确定了哪些信息是可以公开的,因此不会涉及到个人隐私问题。
对于疾控中心和其他研究者来说,Yelpidemiology进行的试验性分析,为今后的食源性疾病研究和应对提供了明确的前进路线,可能会因此而衍生出更强大的信息聚合和分析技术。而对于普通美国人来说,这可能意味着某一天人们能够在去新餐厅尝试美食之前先通过Yelp或其他网站了解其是否存在医疗卫生风险。