3月25日,《江蘇科技報(bào)》A5要聞版《云創(chuàng)大數(shù)據(jù):人工智能助力疫情預(yù)測(cè)研究》,對(duì)云創(chuàng)大數(shù)據(jù)參與鐘南山技術(shù)團(tuán)隊(duì),與多家醫(yī)科院校、醫(yī)療企業(yè)開展合作,對(duì)新冠肺炎疫情走勢(shì)進(jìn)行科學(xué)預(yù)測(cè)進(jìn)行了報(bào)道,并對(duì)預(yù)測(cè)方法、合作細(xì)節(jié),以及研究成果等進(jìn)行了介紹。
自新冠肺炎爆發(fā)以來,為實(shí)現(xiàn)科學(xué)防治,打贏新冠肺炎疫情防控阻擊戰(zhàn)。在廣州醫(yī)科大學(xué)附屬第一醫(yī)院廣州呼吸健康研究院鐘南山院士、何建行院長(zhǎng)、楊子峰教授領(lǐng)導(dǎo)下,橫琴鯨準(zhǔn)智慧醫(yī)療科技有限公司、南京云創(chuàng)大數(shù)據(jù)科技股份有限公司、星環(huán)信息科技(上海)有限公司、澳門科技大學(xué)、昆明理工大學(xué)、香港大學(xué)公共衛(wèi)生學(xué)院,對(duì)新冠肺炎疫情進(jìn)行了全面預(yù)測(cè)研究。
鐘南山院士技術(shù)團(tuán)隊(duì)先后借助改進(jìn)的SEIR模型和人工智能技術(shù)建立了新冠肺炎疫情預(yù)測(cè)模型,通過長(zhǎng)期的觀察發(fā)現(xiàn),疫情實(shí)際走勢(shì)與其做出的預(yù)測(cè)十分吻合,為此受到社會(huì)各界的廣泛認(rèn)可。
迅速建立疫情預(yù)測(cè)模型
2月6日,鐘南山院士技術(shù)團(tuán)隊(duì)便開始迅速收集數(shù)據(jù)進(jìn)行初步研究分析,并對(duì)新型冠狀病毒進(jìn)行預(yù)測(cè)研究。大家對(duì)研究投入了全部的精力,功夫不負(fù)有心人,經(jīng)過連夜奮戰(zhàn),短短幾天就取得了初步成果。
由于新冠肺炎疫情具有未知性、突發(fā)性、高風(fēng)險(xiǎn)和快蔓延等特點(diǎn),同時(shí)疊加春運(yùn)高峰期間學(xué)生放假、企業(yè)員工回家過年等人員跨地域頻繁流動(dòng)等因素,給疫情防控提出了嚴(yán)重挑戰(zhàn)??紤]到以上因素,為科學(xué)預(yù)測(cè)疫情發(fā)展走勢(shì),鐘南山院士技術(shù)團(tuán)隊(duì)先后對(duì)疫情的流行趨勢(shì)做出了兩版預(yù)測(cè)。
第一版預(yù)測(cè):以1月11日到2月12日的數(shù)據(jù)作為輸入數(shù)據(jù),根據(jù)改進(jìn)的SEIR模型進(jìn)行預(yù)測(cè)
鐘南山院士技術(shù)團(tuán)隊(duì)第一版預(yù)測(cè)以1月11日到2月12日的數(shù)據(jù)作為輸入數(shù)據(jù)進(jìn)行研究,并根據(jù)改進(jìn)的SEIR模型進(jìn)行預(yù)測(cè)。結(jié)論顯示,新冠病毒疫情全國在2月下旬達(dá)到高峰,4月底趨于平緩。如管控措施推遲5天實(shí)施,中國大陸的疫情規(guī)模預(yù)估將擴(kuò)大至3倍;如降低武漢管控力度,湖北可能在3月中旬出現(xiàn)第二次疫情高峰并延續(xù)至4月下旬。
圖1 改進(jìn)的SEIR模型預(yù)測(cè)曲線
(A)湖北省有嚴(yán)格管控,(B)湖北省減少管控力度,(C)廣東省,(D)浙江省和(E)中國在1月23日(藍(lán)色),5天后(灰色)和5天前(紅色)采取干預(yù)措施時(shí)的流行曲線,把每天現(xiàn)存確診病例的實(shí)際數(shù)據(jù)被擬合到曲線(圓圈)上
3月初,闡述以上預(yù)測(cè)內(nèi)容的論文《基于SEIR優(yōu)化模型和AI對(duì)公共衛(wèi)生干預(yù)下的中國COVID-19暴發(fā)趨勢(shì)預(yù)測(cè)》在《Journal of Thoracic Disease》(《胸部疾病雜志》)上正式發(fā)表。該文章提出了基于大數(shù)據(jù)的改進(jìn)SEIR預(yù)測(cè)模型,并提出了數(shù)據(jù)受限條件下的人工智能LSTM預(yù)測(cè)方法。
2月下旬,鐘南山院士接受央視4套《今日亞洲》欄目采訪透露,“根據(jù)我們團(tuán)隊(duì)在傳統(tǒng)模型基礎(chǔ)上加上兩個(gè)影響因素,國家強(qiáng)力干預(yù)和春節(jié)后回程高峰消除后,預(yù)測(cè)高峰應(yīng)該在2月中接近2月底。到了2月15日,數(shù)字果然下來了。我們有信心,四月底基本控制?!?/span>
圖2 央視播放鐘南山院士接受采訪
2月27日,廣州市人民政府新聞辦公室舉辦了新冠肺炎疫情防控專場(chǎng)新聞通氣會(huì),鐘南山院士引用了以上結(jié)論。當(dāng)時(shí),鐘南山院士還表示,“疫情開始時(shí),國外就有流行病學(xué)家用權(quán)威的試驗(yàn)?zāi)P停A(yù)測(cè)2月初,中國感染新冠肺炎人數(shù)將達(dá)16萬人。這是沒有考慮到中國政府的強(qiáng)力干預(yù),也沒有考慮到春節(jié)后的延遲復(fù)工。然而我們做的預(yù)測(cè)模型顯示,2月中旬或下旬將達(dá)到疫情高峰,確診病例約六、七萬人。研究論文投到國外權(quán)威期刊,他們感覺和國外的預(yù)測(cè)水平差太多,被退了回來。但事實(shí)上,我們的預(yù)測(cè)更接近權(quán)威?!?/span>
第二版預(yù)測(cè):以1月11日到2月17日的數(shù)據(jù)作為輸入數(shù)據(jù),通過機(jī)器學(xué)習(xí)構(gòu)建人工智能模型
為了更精準(zhǔn)地判斷疫情發(fā)展的各個(gè)關(guān)鍵節(jié)點(diǎn),鐘南山院士技術(shù)團(tuán)隊(duì)迅速著手實(shí)施了第二版預(yù)測(cè)。該版預(yù)測(cè)通過機(jī)器學(xué)習(xí)構(gòu)建了人工智能模型,同時(shí)改變了此前的鑒別方法,以1月11日到2月17日的數(shù)據(jù)作為輸入數(shù)據(jù)進(jìn)行研究。2月9日前,使用“新增確診人數(shù)”作為訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)測(cè);2月13日后,采用“累計(jì)確診+新增疑似-死亡人數(shù)-治愈人數(shù)”作為訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)測(cè)。結(jié)論顯示,全國將會(huì)在2月20日左右達(dá)到拐點(diǎn),最終全國確診病例8萬例左右。
圖3-1 湖北感染人數(shù)預(yù)測(cè)趨勢(shì)與實(shí)際趨勢(shì)對(duì)比
圖3-2 全國感染人數(shù)預(yù)測(cè)趨勢(shì)與實(shí)際趨勢(shì)對(duì)比
縱觀疫情實(shí)際走勢(shì),2月20日左右,湖北省以及全國范圍內(nèi),確診病例、疑似病例顯著減少,疫情出現(xiàn)明顯拐點(diǎn)。截至3月26日10時(shí),全國累計(jì)報(bào)告確診病例81960例。以上均與鐘南山院士技術(shù)團(tuán)隊(duì)做出的預(yù)測(cè)十分接近,這也說明了其疫情預(yù)測(cè)十分準(zhǔn)確。
雖然兩版預(yù)測(cè)采用的監(jiān)測(cè)方式不同,但是采用的預(yù)測(cè)方法是相同的,都是在原始的SEIR模型上引入遷入和遷出人數(shù)。
值得一提的是,建模過程和預(yù)測(cè)結(jié)論的得出,離不開廣州呼吸健康研究院、云創(chuàng)大數(shù)據(jù)技術(shù)團(tuán)隊(duì)、澳門科技大學(xué)人工智能學(xué)院等單位的通力合作。
事實(shí)證明,鐘南山院士技術(shù)團(tuán)隊(duì)做出的與疫情實(shí)際走勢(shì)十分吻合的兩版預(yù)測(cè),為疫情防控策略提供了參考,為政府作出科學(xué)、全局決策提供了科學(xué)依據(jù)。