人工智能在氣候預(yù)測領(lǐng)域應(yīng)用初探(二)
轉(zhuǎn)載于領(lǐng)略氣象
劉冠州,唐偉
5.氣候預(yù)測
5.1遙相關(guān)預(yù)測
Chattopadhyay等人2013年提出了一種基于自組織映射(Self-Organizing Map,SOM)算法的非線性聚類技術(shù),用于識(shí)別馬登-朱利安振蕩(Madden Julian Oscillation, MJO)在其生命周期中的水平和垂直結(jié)構(gòu)。MJO的SOM描述不需要季節(jié)內(nèi)帶通濾波或主導(dǎo)模式的選擇。SOM基于所選變量的狀態(tài)相似性來定義MJO階段。由SOM定義的給定MJO階段的降雨相關(guān)變量的空間模式不同于其他階段的模式。與其他MJO診斷方法相比,SOM具有其獨(dú)特的特征,是提取MJO信號(hào)的可靠且有用的工具。
整個(gè)熱帶地區(qū)的地表溫度變化表現(xiàn)出不同程度的空間一致性,然而這種一致性還沒有得到很好的描述。大面積地理區(qū)域同時(shí)出現(xiàn)的多年高溫異常有可能對(duì)糧食生產(chǎn)和社會(huì)發(fā)展產(chǎn)生不利影響。Yang等人2019年通過對(duì)過去六十年廣泛溫度測量之間的相關(guān)性進(jìn)行聚類分析,發(fā)現(xiàn)70年代后期發(fā)生了重大變化。兩個(gè)空間集群合并為一個(gè)主導(dǎo)的空間集群,因此,大多數(shù)熱帶陸地區(qū)域同時(shí)經(jīng)歷較暖的年份,確定了與太平洋年代際濤動(dòng)(Pacific Decadal Oscillation ,PDO)的陸地?zé)釒?lián)系。
Liess等人2017年提出沃克環(huán)流與北半球極地地區(qū)的溫帶波有關(guān),在北半球冬季,這些波從中亞向東南傳播到西太平洋暖池。波動(dòng)模式類似于東大西洋-西俄羅斯模式,并影響厄爾尼諾-南方濤動(dòng)(El Niño–Southern Oscillation ,ENSO)區(qū)域。西西伯利亞平原和ENSO兩個(gè)活動(dòng)中心之間的三極模式表明,ENSO相對(duì)于全球海平面氣壓(Sea Level Pressure ,SLP)的背景狀態(tài)與西西伯利亞平原有顯著的負(fù)相關(guān)。由ENSO的兩個(gè)作用中心的總和定義的與背景狀態(tài)的相關(guān)性高于單獨(dú)與任一ENSO中心的每一個(gè)成對(duì)相關(guān)性。這些中心由檢測具有相似特征區(qū)域的聚類算法來定義。
厄爾尼諾/南方濤動(dòng)(ENSO)的變化與一系列區(qū)域極端氣候和生態(tài)系統(tǒng)影響有關(guān)。因此,穩(wěn)健的長期預(yù)測對(duì)于管理政策反應(yīng)將是有價(jià)值的。但是,盡管經(jīng)過幾十年的努力,提前一年以上預(yù)測ENSO事件仍然是個(gè)問題。Ham等人2019年研究表明,采用深度學(xué)習(xí)方法的統(tǒng)計(jì)預(yù)測模型可以在長達(dá)一年半的時(shí)間內(nèi)產(chǎn)生熟練的ENSO預(yù)測。為了避開有限數(shù)量的觀察數(shù)據(jù),該研究首先在歷史模擬上使用遷移學(xué)習(xí)來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network ,CNN),隨后重新分析1871-1973年。在1984年至2017年的驗(yàn)證期間,CNN模型的Nino3.4指數(shù)的全季節(jié)相關(guān)技能遠(yuǎn)遠(yuǎn)高于當(dāng)前最先進(jìn)的動(dòng)力預(yù)報(bào)系統(tǒng)。CNN模式在預(yù)測海面溫度的詳細(xì)帶狀分布方面也更好,克服了動(dòng)力預(yù)測模式的弱點(diǎn)。熱圖分析表明,CNN模型使用物理上合理的前兆來預(yù)測ENSO事件。因此,CNN模型是預(yù)測ENSO事件和分析其相關(guān)復(fù)雜機(jī)制的有力工具。
5.2極端氣候預(yù)測
在大型數(shù)據(jù)集中檢測極端事件是氣候科學(xué)研究中的一個(gè)主要挑戰(zhàn)。當(dāng)前極端事件檢測算法建立在人類根據(jù)相關(guān)物理變量的主觀閾值定義事件的專業(yè)知識(shí)之上。通常,多種相互競爭的方法會(huì)在同一數(shù)據(jù)集上產(chǎn)生非常不同的結(jié)果。氣候模擬和觀測數(shù)據(jù)中極端事件的準(zhǔn)確描述對(duì)于理解氣候變化內(nèi)容中此類事件的趨勢和潛在影響至關(guān)重要。Liu等人2016年首次將深度學(xué)習(xí)技術(shù)應(yīng)用于氣候極端事件檢測。深度神經(jīng)網(wǎng)絡(luò)能夠從標(biāo)記的數(shù)據(jù)中學(xué)習(xí)一大類模式的高級(jí)表示。在這項(xiàng)工作中,我們開發(fā)了深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)分類系統(tǒng),并證明了深度學(xué)習(xí)技術(shù)在處理氣候模式檢測問題中的有效性。結(jié)合基于貝葉斯的超參數(shù)優(yōu)化方案,深度CNN系統(tǒng)在檢測極端事件方面達(dá)到了89%-99%的準(zhǔn)確度。
對(duì)未來干旱的預(yù)測是評(píng)估干旱事件對(duì)重要水資源、農(nóng)業(yè)、生態(tài)系統(tǒng)和水文的不利后果的有效緩解工具。使用機(jī)器學(xué)習(xí)算法的數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測是實(shí)現(xiàn)這些目的的有希望的原則,因?yàn)樗鼈冃枰^少的開發(fā)時(shí)間、最少的輸入,并且比動(dòng)態(tài)或物理模型相對(duì)簡單。Deo和 Sahin2015年使用1957-2008年訓(xùn)練的輸入數(shù)據(jù)和2009-2011年期間預(yù)測的月度干旱指數(shù),驗(yàn)證了一種計(jì)算簡單、快速和有效的非線性深度學(xué)習(xí)算法,稱為極限學(xué)習(xí)機(jī)(Extreme Learning Machine ,ELM),用于預(yù)測澳大利亞東部的有效干旱指數(shù)。預(yù)測指標(biāo)證明了ELM在所有測試點(diǎn)優(yōu)于ANN模型的性能。此外,ELM模型的學(xué)習(xí)速度比ANN模型快32倍,訓(xùn)練速度比ANN模型快6.1倍。ELM模型對(duì)干旱持續(xù)時(shí)間和嚴(yán)重程度的預(yù)測能力得到了提高,所以ELM是預(yù)測干旱及其相關(guān)特性的更快捷的工具。
降水不足引發(fā)的干旱受溫度和蒸發(fā)蒸騰等各種環(huán)境因素的影響,導(dǎo)致缺水和作物歉收問題。在Park等人2016年的研究中,來自中分辨率成像光譜儀和熱帶降雨測量衛(wèi)星傳感器的16個(gè)基于遙感的干旱因素被用于監(jiān)測美國不同氣候區(qū)域 2000-2012 年生長季節(jié)的氣象和農(nóng)業(yè)干旱,時(shí)間尺度為1至12個(gè)月的標(biāo)準(zhǔn)化降水指數(shù)和作物產(chǎn)量數(shù)據(jù)分別用作氣象和農(nóng)業(yè)干旱的參考數(shù)據(jù)。通過隨機(jī)森林、增強(qiáng)回歸樹等機(jī)器學(xué)習(xí)方法對(duì)16個(gè)基于遙感的干旱因素與現(xiàn)場參考數(shù)據(jù)之間的關(guān)系進(jìn)行建模,這些方法在許多回歸任務(wù)中被證明是穩(wěn)健和靈活的。結(jié)果表明,隨機(jī)森林產(chǎn)生了最好的性能用于標(biāo)準(zhǔn)化降水指數(shù)預(yù)測。
Belayneh等人2016年探討了耦合機(jī)器學(xué)習(xí)模型和集成技術(shù)預(yù)測埃塞俄比亞阿瓦什河流域干旱狀況的能力,探索了小波變換與自舉和增強(qiáng)集成技術(shù)開發(fā)可靠的人工神經(jīng)網(wǎng)絡(luò)和支持向量回歸模型用于干旱預(yù)測的潛力。小波分析被證明可以改善干旱預(yù)測并改善所有模型的預(yù)測結(jié)果。
5.3中國區(qū)域氣候預(yù)測應(yīng)用
夏季降水的季節(jié)預(yù)報(bào)對(duì)減少區(qū)域性災(zāi)害至關(guān)重要,但目前預(yù)報(bào)水平較低。Wang等人2021年基于中國科學(xué)院靈活全球海洋-大氣-陸地系統(tǒng)有限體積2代版本模式(Flexible Global Ocean-Atmosphere-Land System Model finite volume version 2,FGOALS-f2)動(dòng)力預(yù)報(bào)模式的環(huán)流場,開發(fā)了一種動(dòng)力和機(jī)器學(xué)習(xí)混合(Dynamical and Machine Learning hybrid,MLD)的中國夏季降水季節(jié)預(yù)報(bào)方法。通過為三種機(jī)器學(xué)習(xí)方法選擇最佳超參數(shù)以獲得最佳擬合和最小過擬合,隨機(jī)森林和梯度增強(qiáng)回歸樹方法的集合均值顯示出以異常相關(guān)系數(shù)衡量的最高預(yù)測能力。該技能在歷史交叉驗(yàn)證期(1981-2010年)的平均值為0.34,在獨(dú)立預(yù)測的10年期(2011-2020年)的平均值為0.20,顯著提高了400%的動(dòng)態(tài)預(yù)測能力。減少過擬合和使用最佳動(dòng)態(tài)預(yù)測在MLD方法的應(yīng)用中都很重要,對(duì)這些方法的深入分析值得進(jìn)一步研究。
與我國旱澇災(zāi)害密切相關(guān)的降水變化,每年影響著數(shù)十億人。然而,比天氣預(yù)報(bào)難度更大的次季節(jié)預(yù)報(bào)在很長一段時(shí)間內(nèi)仍是氣象服務(wù)的一個(gè)空白領(lǐng)域。為了提高中國降水的次季節(jié)預(yù)測精度,Wang等人2021年引入了機(jī)器學(xué)習(xí)方法,提前2-6周對(duì)中國降水進(jìn)行預(yù)測,使用一種稱為局部線性回歸的非線性回歸模型和多任務(wù)特征選擇(Local Linear Regression together with Multitask Feature Selection ,MultiLLR)模型,選擇21個(gè)氣象要素作為候選預(yù)報(bào)因子來整合不同的氣象觀測數(shù)據(jù)。該方法通過多任務(wù)特征選擇過程,自動(dòng)剔除無關(guān)預(yù)測因子,建立預(yù)測方程。該方法可為中國降水的次季節(jié)預(yù)測提供有效的指導(dǎo)。通過在MultiLLR模型中加入另外三個(gè)因子,即北極濤動(dòng)指數(shù)、西北太平洋季風(fēng)指數(shù)和西北太平洋副熱帶高壓指數(shù),發(fā)現(xiàn)北極濤動(dòng)能指數(shù)最大程度地提高對(duì)中國降水的預(yù)報(bào)能力,其次是西北太平洋副熱帶高壓指數(shù)。此外,該模式和美國國家環(huán)境預(yù)報(bào)中心CFSv2模式的集合可以將CFSv2對(duì)中國降水的次季節(jié)預(yù)報(bào)技術(shù)提高近40%。這一工作表明,MultiLLR模式將有助于我國次季節(jié)降水的預(yù)測。
長江流域的中下游是中國人口最稠密的地區(qū)之一,洪水頻繁。He等人2021年采用預(yù)測因子重要性分析模型對(duì)預(yù)測因子進(jìn)行分類和篩選,并采用五種方法(多元線性回歸(Multiple Linear Regression,MLR)、決策樹(Decision Tree,DT)、隨機(jī)森林(Random Forest,RF)、反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN))對(duì)長江流域中下游夏季降水的年際變化進(jìn)行預(yù)測。八個(gè)氣候模型的預(yù)測被用于比較。在五種測試方法中,RF顯示出最好的預(yù)測能力。當(dāng)從冬季開始預(yù)測時(shí),RF、DT和氣候模型都顯示出比早春更高的預(yù)測技能,并且RF、DT和MLR方法都顯示出比數(shù)值氣候模型更好的預(yù)測技能。缺乏訓(xùn)練數(shù)據(jù)是限制機(jī)器學(xué)習(xí)方法性能的一個(gè)因素。未來的研究應(yīng)該使用深度學(xué)習(xí)方法,充分利用海洋、陸地、海冰和其他因素的潛力,進(jìn)行更準(zhǔn)確的氣候預(yù)測。
Fan等人2023年使用基于深度學(xué)習(xí)的堆疊式自動(dòng)編碼器進(jìn)行非線性降尺度,以在早期壓縮氣候變量的自由度。研究從中國東部四個(gè)地區(qū)的夏季降水中提取氣候因子特征,從中識(shí)別出影響各地區(qū)夏季降水的關(guān)鍵氣候因子。在此基礎(chǔ)上,采用包括機(jī)器學(xué)習(xí)方法中的隨機(jī)森林在內(nèi)的多種回歸方法,構(gòu)建各區(qū)域關(guān)鍵氣候預(yù)測因子的預(yù)測模型。通過模型參數(shù)對(duì)預(yù)測結(jié)果的敏感性試驗(yàn),確定了最佳模型參數(shù)。幾年的預(yù)報(bào)表明,該方法對(duì)中國東部降水的預(yù)報(bào)有很高的技巧,特別是在中國南方。結(jié)果表明,該模型在區(qū)域預(yù)測中的異常一致性優(yōu)于主流模式。與主流模式相比,華南地區(qū)的預(yù)測結(jié)果可提高10%以上。該方法在中國東部夏季降水預(yù)測中具有良好的應(yīng)用前景。
盡管近年來取得了重大進(jìn)展,但中國季節(jié)性降水的預(yù)報(bào)技術(shù)仍然有限。Jin等人2022年開發(fā)了一個(gè)基于深度學(xué)習(xí)的中國季節(jié)性降水統(tǒng)計(jì)預(yù)測模型。使用同期大氣環(huán)流數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,以學(xué)習(xí)季節(jié)性降水的分布。首先,用幾個(gè)大氣環(huán)流模型(GCM)的回報(bào)結(jié)果對(duì)其進(jìn)行了預(yù)訓(xùn)練,對(duì)測試集的評(píng)估表明,預(yù)訓(xùn)練的模型基本上可以再現(xiàn)GCM預(yù)測的降水,其異常模式相關(guān)系數(shù)(Pattern Correlation Coefficients,PCCs)大于0.80。然后,利用ECMWF再分析資料(ECMWF Reanalysis v5,ERA5)資料和中國區(qū)域網(wǎng)格降水觀測資料進(jìn)行遷移學(xué)習(xí),進(jìn)一步修正模型中的系統(tǒng)誤差。結(jié)果表明,以再分析得到的大氣環(huán)流場作為輸入,該混合模式對(duì)中國的季節(jié)降水模擬效果較好,PCC達(dá)到0.71。此外,還評(píng)估了使用GCMs預(yù)測的環(huán)流場作為輸入的結(jié)果?偟膩碚f,與原始的GCM輸出相比,建議的模型在1-4個(gè)月的時(shí)間內(nèi)將中國的PCC提高了0.10-0.13。這種深度學(xué)習(xí)模型在過去兩年中已被中國氣象局國家氣候中心用于為中國夏季降水預(yù)測提供指導(dǎo),并且表現(xiàn)非常好。
6.結(jié)語
隨著人工智能的蓬勃發(fā)展,機(jī)器學(xué)習(xí)等關(guān)鍵技術(shù)領(lǐng)域都取得了長足的進(jìn)步。通過人工智能強(qiáng)大的學(xué)習(xí)和計(jì)算能力,對(duì)不同的氣候數(shù)據(jù)類型使用最為匹配的算法,捕捉氣候大數(shù)據(jù)的潛在特征,通過人工智能模型訓(xùn)練獲得最佳的預(yù)測結(jié)果,通過上文的梳理可以發(fā)現(xiàn)國內(nèi)外的大量專家學(xué)者都已取得顯著的研究進(jìn)展。
但目前人工智能氣候預(yù)測的準(zhǔn)確率、穩(wěn)定性、預(yù)測產(chǎn)品多樣化與精細(xì)化需求等方面還需進(jìn)一步的提高。第一,需要與更多的氣候模式產(chǎn)品相結(jié)合,比如區(qū)域氣候模式產(chǎn)品和大氣環(huán)流模式產(chǎn)品等,進(jìn)一步提高人工智能氣候預(yù)測產(chǎn)品的時(shí)空分辨率,進(jìn)而提升氣候遙相關(guān)、極端氣候、集合預(yù)報(bào)等氣候預(yù)測產(chǎn)品的質(zhì)量。第二,需要在氣候預(yù)測中引入隨著人工智能技術(shù)發(fā)展而更為成熟、先進(jìn)的深度學(xué)習(xí)方法,進(jìn)一步拓寬升級(jí)人工智能氣候預(yù)測的技術(shù)數(shù)字工具箱,提高氣候預(yù)測的準(zhǔn)確性。
總的來說,人工智能在氣候預(yù)測領(lǐng)域大有可為,應(yīng)將人工智能充分融入氣候預(yù)測,進(jìn)一步提升氣候預(yù)測技術(shù)和能力,以幫助人類更好地應(yīng)對(duì)日益復(fù)雜的區(qū)域、全球的氣候變化和極端氣候事件。
(本文推送前略有修改)
END
—————————————————————————————————
來源 |中國信息化,2023,(10):29-35
作者單位 | 中國氣象局氣象發(fā)展與規(guī)劃院
編輯 | 馮裕健
- 上一篇:沒有啦
- 下一篇:人工智能在氣候預(yù)測領(lǐng)域應(yīng)用初探(一) 2024/2/5