貝小戎
5月2日,我在昆明機(jī)場(chǎng)候機(jī),隨手撿了一本別人遺留下來(lái)的People雜志翻了翻。一位同伴說(shuō):“你也不怕甲型H1N1流感?”因?yàn)樗@一問(wèn),回家后我上網(wǎng)搜索了一下甲型H1N1流感的傳播途徑。也許我這一搜還為疫情預(yù)測(cè)作了貢獻(xiàn)。5月3日,《紐約時(shí)報(bào)》的一篇報(bào)道說(shuō),上周,“甲型H1N1流感”取代“美國(guó)偶像”,成為Yahoo上最熱門(mén)的搜索關(guān)鍵詞。維基百科上“甲型H1N1流感”的頁(yè)面在周三和周四的訪問(wèn)量達(dá)130萬(wàn)。Twitter上每天提到甲型H1N1流感的更新估計(jì)有125000條,占總量的1%。Facebook上有一幅美國(guó)地圖,展示用戶在自我介紹頁(yè)面上提到“甲型H1N1流感”的頻率,提到“甲型H1N1流感”的用戶所在的州被用深藍(lán)色加以標(biāo)注。網(wǎng)絡(luò)提供了一條前所未有的途徑,供我們了解人們關(guān)心什么。
跟用網(wǎng)絡(luò)搜索頻率預(yù)測(cè)“美國(guó)偶像”的比賽結(jié)果不同,預(yù)測(cè)季節(jié)性流感什么時(shí)候達(dá)到高峰(通常是在11月到次年4月之間)能夠拯救很多人的生命,當(dāng)局可以據(jù)此計(jì)劃接種疫苗的時(shí)間、增加醫(yī)院的人手和有序地提供治療措施。
艾奧瓦州大學(xué)副教授菲利普·博格林研究了雅虎的搜索數(shù)據(jù)能否用來(lái)預(yù)測(cè)流感的暴發(fā)。2月的《自然》雜志上有一篇文章,金斯伯格和他的五位共同作者描述了兩組信息,一組是五年內(nèi)政府記錄的病人報(bào)告流感癥狀的頻率,一組是谷歌的搜索數(shù)據(jù),然后試著找出兩組信息的重疊之處,以此來(lái)判斷人們搜索最好的體溫計(jì)和離家最近的急診室是否意味著更多有流感癥狀的人去醫(yī)院就診。
這種關(guān)聯(lián)必須反復(fù)出現(xiàn)。如果結(jié)果表明在流感暴發(fā)前,人們對(duì)速凍樹(shù)莓有一種神秘的食欲,谷歌的流感趨勢(shì)報(bào)告就會(huì)把這種研究添加至算法中。
過(guò)去,流感監(jiān)測(cè)是觀察藥房里感冒藥的銷量何時(shí)達(dá)到最高。傳統(tǒng)的和網(wǎng)絡(luò)時(shí)代疫情監(jiān)測(cè)共同面臨的挑戰(zhàn)是要忽略掉“雜音”,集中于真正有意義的現(xiàn)象。傳統(tǒng)監(jiān)測(cè)中的雜音,比如感冒藥打折優(yōu)惠銷售,導(dǎo)致銷量陡增,這跟人們的健康狀況無(wú)關(guān)。而在網(wǎng)上,雜音無(wú)處不在。所以,如果想通過(guò)分析Twitter來(lái)預(yù)測(cè)流感何時(shí)暴發(fā),就不能搜索甲型H1N1流感一詞,應(yīng)該搜索相關(guān)癥狀。但Twitter確實(shí)提供了一種獨(dú)一無(wú)二的途徑。人們更有可能在Twitter上說(shuō)自己感到不舒服,而不是說(shuō)去看醫(yī)生。人們?cè)谏缃痪W(wǎng)站上非常坦誠(chéng),所以對(duì)公共衛(wèi)生機(jī)構(gòu)來(lái)說(shuō)是一種重要的工具。
十年來(lái),網(wǎng)絡(luò)使衛(wèi)生機(jī)構(gòu)能夠更早地監(jiān)測(cè)到病毒的出現(xiàn):地方公共衛(wèi)生機(jī)構(gòu)把報(bào)告貼到網(wǎng)上,隨后關(guān)鍵詞掃描程序能夠收集到這些數(shù)據(jù)。美國(guó)西北大學(xué)復(fù)雜系統(tǒng)研究所的一個(gè)計(jì)算機(jī)模型通過(guò)跟蹤美元的流通預(yù)測(cè)流感疫情。截至5月3日,根據(jù)這個(gè)模型的預(yù)測(cè),到月底美國(guó)只會(huì)出現(xiàn)2000例感染,大部分在紐約、洛杉磯、邁阿密和休斯敦。該模型的預(yù)測(cè)結(jié)果跟疾病控制中心的統(tǒng)計(jì)數(shù)據(jù)大致吻合,計(jì)算機(jī)模型預(yù)測(cè)的是150至170例,疾控中心確認(rèn)的是226例。
這個(gè)計(jì)算機(jī)模型依據(jù)的是一個(gè)名叫“喬治在哪里?”的網(wǎng)站中的數(shù)據(jù)。這個(gè)網(wǎng)站是程序員漢斯·艾斯金十多年前建的,他在他拿到的每張美鈔上請(qǐng)求下一個(gè)拿到這張美鈔的人去這個(gè)網(wǎng)站輸入其序列號(hào),并留下郵政編碼。他只是想看看美鈔流通有多快、能流通到多遠(yuǎn)的地方。到2006年,這個(gè)網(wǎng)站已經(jīng)記錄了1億美元美鈔的流通情況。
從德國(guó)訪問(wèn)這個(gè)網(wǎng)站的布洛克曼博士無(wú)意間聽(tīng)說(shuō)了這個(gè)網(wǎng)站,意識(shí)到這正是他需要的東西:一個(gè)面對(duì)面交易的地圖,跟流感的傳播類似。
印第安納大學(xué)的計(jì)算機(jī)模型依據(jù)的是全美的航空和公共交通網(wǎng)絡(luò)。它跟西北大學(xué)的計(jì)算機(jī)模型有一些類似的假設(shè),比如,每個(gè)感染者會(huì)傳染給1.7至2.8人。布洛克曼說(shuō)平均數(shù)不能說(shuō)明多少問(wèn)題,可能一名學(xué)生會(huì)傳染給15名同學(xué),但在有的學(xué)校傳染率只有0.1,這就好比把比爾·蓋茨放在埃塞俄比亞,然后說(shuō)該國(guó)的人均收入非常高。但有一件事是確定的:“人們對(duì)大數(shù)有著奇怪的感知。如果一個(gè)3億人的國(guó)家有2000人感染了病毒,大部分人會(huì)認(rèn)為他們將成為這2000人之一,而不是余下的299998000人中的一個(gè)?!?/p>
相關(guān)閱讀