利用google可以预测流感传播趋势
一个很直观的感觉——在流感爆发季节,人们会通过google等搜索工具了解流感的爆发情况以及应对流感的一些措施,那么在这段时间内某些与流感的关键词,如流感、勤洗手、带口罩、流感疫苗等会高频率出现。同样地,在流感爆发季节,人们也会通过twitter等工具反映用户本人、朋友是否感染流感,或者与流感相关的信息等。因此利用google/twitter等工具抓取与流感相关的关键词,通过分析这些关键词的频率发现,相对于传统的疾病监测系统,这种方法可以很好预测流感的传播情况,尤为重要的是,这种方法的代价低而且仅仅比流感爆发的时间晚1天!这些在线工具还可以预测很多东西,比如有可能的暴乱、股市的走势、房屋价格、大选结果以及失业率等等。反正被说的很牛叉。当然它也有不足的地方,比如有一个超级明星在某个时间段发了一条关于自己得流感的微博,马上这条消息可能被大范围的传播,但是这并不代表流感已经是大范围传播了。因此在研究中要充分考虑不同的噪音的影响。
关于这方面的研究最近超级火爆,对于会处理大型数据的人这个方向应该不难,有兴趣的可以看看下面几篇文献,
1,Ginsberg J, Mohebbi MH, Patel RS, Brammer L, Smolinski MS, et al. (2009)
Detecting influenza epidemics using search engine query data. Nature
457(7232): 1012–4.(已经被引用600+,另外从网站找到了这篇nature的中文翻译,《利用查询数据探测流感传播》,中国计算机学会通讯、第 7 卷 第 8 期 2011 年 8 月。)
2,Signorini A, Segre AM, Polgreen PM (2011) The Use of Twitter to Track Levels
of Disease Activity and Public Concern in the U.S. during the Influenza A H1N1
Pandemic. PLoS ONE 6: e19467.
3,Salathe M, Khandelwal S (2011) Assessing Vaccination Sentiments with Online Social Media: Implications for Infectious Disease Dynamics and Control. PLoS Comput Biol 7(10): e1002199. doi:10.1371/journal.pcbi.1002199
google流感预测(转载http://www.google.org/flutrends/intl/zh_cn/about/how.html)
它的工作原理是怎样的?
我们发现,某些搜索字词非常有助于了解流感疫情。Google 流感趋势会根据汇总的 Google 搜索数据,近乎实时地对全球当前的流感疫情进行估测。
全球每星期会有数以百万计的用户在网上搜索健康信息。正如您所预料的那样,在流感季节,与流感有关的搜索会明显增多;到了过敏季节,与过敏有关的搜索会显著上升;而到了夏季,与晒伤有关的搜索又会大幅增加。所有这些现象均可通过 Google 搜索解析进行研究。 但是,搜索查询趋势能否为实际现象建立一个准确可靠的模式而提供依据呢?
我们发现,搜索流感相关主题的人数与实际患有流感症状的人数之间存在着密切的关系。当然,并非每个搜索“流感”的人都真的患有流感,但当我们将与流感有关的搜索查询汇总到一起时,便可以找到一种模式。我们将自己统计的查询数量与传统流感监测系统的数据进行了对比,结果发现许多搜索查询在流感季节确实会明显增多。通过对这些搜索查询的出现次数进行统计,我们便可以估测出世界上不同国家和地区的流感传播情况。我们的研究结果已发表在美国《自然》杂志上。
这些图表显示了根据历史查询所得的不同国家和地区的流感估测结果,以及这些结果与官方的流感监测数据的对比。从图中可以看出,根据与流感相关的 Google 搜索查询所得到的估测结果,与以往的流感疫情指示线非常接近。当然,过去的表现并不能保证以后的结果一定准确。
我们为何要不厌其烦地根据汇总的搜索查询来估测疫情呢?传统的流感监测系统非常重要,但大多数卫生机构都只关注单个国家或地区,而且每隔一个星期才会更新一次估测数据。目前,我们已在全球的若干国家/地区推出 Google 流感趋势,此产品的数据每天都在更新,可为现有的流感监测系统提供有益的补充。
详细了解 Google 流感趋势背后的研究过程:
阅读美国《自然》杂志发表的文章“运用搜索引擎查询数据检测流感疫情”(Detecting influenza epidemics using search engine query data)
对于流行病学家而言,这个系统的开发是他们所喜闻乐见的,因为如果能及早监测到疫情爆发的征兆,就可以显著减少患病人数。当一株新的流感病毒在特定条件下形成后,一旦在全球范围内流行,就可能会夺去数百万人的生命(例如,1918 年就发生过这种灾难)。我们最新的流感估测结果可帮助公共卫生官员和专业卫生技术人员更好地应对季节性流感。
流感趋势试验版
我们发现,在我们推出流感趋势试验版的国家/地区中,根据汇总的流感相关查询所得到的季节性曲线与实际的流感疫情水平非常接近。通常,这些估测结果并没有与官方的流感监测数据进行对比。这些试验性的估测结果可从流感趋势试验版的相应国家/地区页面下载。
保护用户的隐私权
Google 深知用户对我们的信任,而且致力于保护用户的隐私。我们以匿名方式统计某些搜索查询在每星期的出现次数,因此 Google 流感趋势绝不会被用来确定个人用户的身份。我们依据的是长期以来发送至 Google 的数以百万计的搜索查询,而我们观察到的数据模式只适合 Google 搜索用户这个庞大的群体。要详细了解这些数据的使用情况以及 Google 如何保护用户的隐私权,请访问我们的隐私权中心。
本文引用地址:http://blog.sciencenet.cn/blog-291824-644684.html此文来自科学网张海峰博客,转载请注明出处。
页:
[1]