「預(yù)測神器」:基于深度學(xué)習(xí)的各種天氣預(yù)報模型研究
原創(chuàng)
基于深度學(xué)習(xí)的各種天氣預(yù)報模型研究
由于其對全球人類生活的影響,天氣預(yù)報引起了幾位不同研究領(lǐng)域研究人員的興趣。由于最近深度學(xué)習(xí)技術(shù)的發(fā)展,海量天氣觀測數(shù)據(jù)的廣泛可用性以及信息和計算機(jī)技術(shù)的出現(xiàn),許多研究的動機(jī)是探索大量天氣預(yù)報天氣數(shù)據(jù)集中隱藏的分層模式。ML技術(shù)已被應(yīng)用于預(yù)測極端天氣事件,識別觀測和建模大氣條件下的極端天氣和氣候模式,并為惡劣天氣提供操作指導(dǎo)和風(fēng)險評估。在過去的幾年里,基于深度學(xué)習(xí)的天氣預(yù)報模型得到了發(fā)展,如MetNet-2,WF-UNet,ClimaX,GraphCast,Pangu-Weather等。本文簡要討論了這些模型,以深入了解這些模型如何快速擊敗傳統(tǒng)的氣象模式。
ClimaX:天氣與氣候的基礎(chǔ)模型
基于物理學(xué)的數(shù)值大氣模型是當(dāng)今天氣和氣候預(yù)報軟件的支柱。這些技術(shù)模擬了非線性動力學(xué)和復(fù)雜的多變量相互作用,使它們的近似仍充滿了挑戰(zhàn)。以高精度空間和時間分辨率對大氣過程進(jìn)行數(shù)值模擬對計算要求很高;跈C(jī)器學(xué)習(xí)的最新數(shù)據(jù)驅(qū)動技術(shù)通過在深度神經(jīng)網(wǎng)絡(luò)中訓(xùn)練數(shù)據(jù)驅(qū)動的函數(shù)映射,直接處理下游預(yù)測或預(yù)測任務(wù)。這些網(wǎng)絡(luò)缺乏數(shù)值模型的通用性,因?yàn)樗鼈兪窃陔x散時空任務(wù)的有限和一致的氣候數(shù)據(jù)上進(jìn)行訓(xùn)練的。
微軟自治系統(tǒng)和機(jī)器人研究,微軟研究院AI4Science和加州大學(xué)洛杉磯分校的新研究提出了ClimaX,這是一種用于天氣和氣候科學(xué)的深度學(xué)習(xí)模型,可以在具有不同變量,空間和時間覆蓋范圍以及物理基礎(chǔ)的不同數(shù)據(jù)集上進(jìn)行訓(xùn)練。ClimaX使用CMIP6氣候數(shù)據(jù)集進(jìn)行無監(jiān)督訓(xùn)練。為了在保持廣泛可用性的同時增加計算能力,ClimaX 用新穎的編碼和聚合塊擴(kuò)展了 Transformer。
在初始訓(xùn)練之后,climaX可能會被微調(diào)以執(zhí)行廣泛的氣候和天氣工作,包括那些涉及大氣變量和不同時間和空間尺度的工作。即使在較低的分辨率和較少的計算預(yù)算下進(jìn)行預(yù)訓(xùn)練,ClimaX 的通用性使其在天氣預(yù)報和氣候預(yù)測基準(zhǔn)上的表現(xiàn)優(yōu)于數(shù)據(jù)驅(qū)動的基線。
研究人員認(rèn)為,這種方法的普遍性可能使其可用于更多樣化的目的。這可能包括預(yù)測極端天氣事件和評估人為氣候變化,這是地球系統(tǒng)科學(xué)任務(wù)的兩個例子,可以從已經(jīng)預(yù)先訓(xùn)練的ClimaX骨干中受益。農(nóng)業(yè)、人口學(xué)和精算科學(xué)也是有趣的候選人,因?yàn)樗鼈兣c天氣和氣候密切相關(guān)。
盤古-全球天氣預(yù)報
華為云計算團(tuán)隊推出基于深度學(xué)習(xí)的全球天氣預(yù)報系統(tǒng)Pangu-Weather。該團(tuán)隊從 ECMWF 的第五代再分析 (ERA5) 中收集了 43 年的每小時全球氣象數(shù)據(jù),以創(chuàng)建數(shù)據(jù)驅(qū)動的環(huán)境并訓(xùn)練幾個具有 2.56 億個參數(shù)的深度神經(jīng)網(wǎng)絡(luò)。
這是第一種基于人工智能的方法,在所有變量(如地勢、比濕度、風(fēng)速、溫度等)和所有時間尺度(從一小時到一周)的準(zhǔn)確性方面優(yōu)于尖端的數(shù)值天氣預(yù)報 (NWP) 技術(shù)。使用分層時間聚合策略和將高度(壓力水平)數(shù)據(jù)轉(zhuǎn)換為立方數(shù)據(jù)的 3D 地球?qū)S米儔浩?(3DEST) 架構(gòu)來提高預(yù)測精度。中短程確定性預(yù)測是盤古的強(qiáng)項(xiàng)。天氣(即預(yù)測時間范圍從一小時到一周不等)。
Pangu-Weather提供了幾種下游預(yù)報選項(xiàng),例如熱帶氣旋跟蹤和實(shí)時大型集成預(yù)報。Pangu-Weather回答了基于AI的技術(shù)是否比NWP技術(shù)表現(xiàn)更好的問題,并為增強(qiáng)深度學(xué)習(xí)天氣預(yù)報系統(tǒng)提出了新的建議。
該團(tuán)隊認(rèn)為,他們的訓(xùn)練方法尚未達(dá)到完全收斂。還有空間增加觀測組件的數(shù)量,將時間維度整合到4D深度網(wǎng)絡(luò)的訓(xùn)練中,并使用更深和/或更寬的網(wǎng)絡(luò)。所有這些都需要具有更多內(nèi)存和 FLOP 的 GPU。因此,由于計算資源,未來的天氣預(yù)報會更好。
多分辨率深度學(xué)習(xí)框架
極端天氣事件嚴(yán)重威脅著人類生命和經(jīng)濟(jì),每年造成數(shù)十億美元的損失和數(shù)萬人的生命損失。由于氣候變化,其后果和強(qiáng)度預(yù)計將增加。不幸的是,作為氣候預(yù)測的主要工具,環(huán)流模型(GCMs)無法充分定義極端天氣。
來自Verisk Analytics,Otto-von-Guericke大學(xué)和麻省理工學(xué)院的一組科學(xué)家開發(fā)了一種多分辨率深度學(xué)習(xí)框架,以加速極端天氣事件的模擬。為了消除偏差并提高GCM仿真的分辨率,他們將以粗分辨率執(zhí)行的基于物理的GCM與在觀測數(shù)據(jù)上訓(xùn)練的機(jī)器學(xué)習(xí)模型混合在一起。
主要成分是:
· 一種分而治之的訓(xùn)練策略,允許以高空間分辨率訓(xùn)練區(qū)域模型
· 強(qiáng)調(diào)極值和時空相干性的新型統(tǒng)計損失函數(shù)
· 球體上物理過程的緊湊、多尺度表示,可有效捕獲跨尺度的能量轉(zhuǎn)移。
決策者可以利用全尺寸去偏模擬來查看當(dāng)前場景并衡量他們遭受災(zāi)難性天氣災(zāi)害的風(fēng)險,所有這些都具有任意的詳細(xì)程度。
建議的架構(gòu)使百萬年的極端天氣模擬成為可能,改善了災(zāi)害事件的量化。隨著對全球模擬的需求不斷增加,這些模擬可以解釋跨多個地理位置和威脅的相互依賴性,研究人員認(rèn)為這將有助于滿足這一要求。
風(fēng)場預(yù)報的實(shí)時偏差校正
歐洲中期天氣預(yù)報中心(ECMWF;簡稱EC)預(yù)測可以作為開發(fā)海上災(zāi)害預(yù)警系統(tǒng)的基礎(chǔ),同時包含一些系統(tǒng)偏差。歐盟委員會第五代大氣再分析(ERA5)數(shù)據(jù)高度準(zhǔn)確;但是,已經(jīng)晚了幾天。EC和ERA5數(shù)據(jù)之間的非線性映射可以通過時空深度學(xué)習(xí)方法得到改進(jìn),從而允許EC進(jìn)行更準(zhǔn)確的實(shí)時風(fēng)力預(yù)報。
中國海洋大學(xué)、國家海洋環(huán)境預(yù)報中心和樸茨茅斯大學(xué)最近的一項(xiàng)研究設(shè)計了一種多任務(wù)學(xué)習(xí)損失函數(shù),可以使用單一模型來校正風(fēng)速和風(fēng)向。他們在多任務(wù)雙編碼器軌跡門控循環(huán)單元 (MT-DETrajGRU) 模型中實(shí)現(xiàn)了它,該模型采用增強(qiáng)的“雙編碼器預(yù)報器”架構(gòu)來模擬時空序列風(fēng)分量。西北太平洋 (WNP) 作為研究區(qū)域。從 2020 年 12 月到 2021 年 11 月的所有四個季節(jié),EC 的 10 天風(fēng)場預(yù)報都針對滾動偏差進(jìn)行了實(shí)時校正。經(jīng)MT-DETrajGRU模型調(diào)整后,四個季節(jié)的風(fēng)速和風(fēng)向偏差較EC原預(yù)報分別降低了8-11%和9-14%。
此外,所提出的技術(shù)在不同氣候條件下一致地模擬了數(shù)據(jù)。這里構(gòu)建的數(shù)據(jù)驅(qū)動模式具有彈性和可推廣性,在正常和臺風(fēng)條件下的類似校正性能證明了這一點(diǎn)。該團(tuán)隊計劃在未來的調(diào)查中將影響風(fēng)場的其他變量(如溫度,氣壓和濕度)納入模型中。
使用天氣模式預(yù)測風(fēng)電場功率和下游尾流
ECMWF,波恩,倫敦帝國理工學(xué)院,英國氣象局,埃克塞特和殼牌研究有限公司的一項(xiàng)新研究建立了一種新的風(fēng)能工作流程,首次展示了如何將復(fù)雜的數(shù)值天氣預(yù)報模型與無監(jiān)督聚類算法成功集成,以有效地對風(fēng)電場功率和下游尾流進(jìn)行準(zhǔn)確的長期預(yù)測。此過程首先使用對 ERA5 再分析數(shù)據(jù)的無監(jiān)督 k 均值聚類來識別天氣趨勢,以考慮區(qū)域和時間變化。為了計算集群功率輸出和下游風(fēng)電場尾流,使用集群中心的平均氣象條件進(jìn)行WRF模擬。
該分析確定了海上風(fēng)能生產(chǎn)天氣模式的最佳變量和域大小。在運(yùn)行WRF仿真后,該團(tuán)隊將獨(dú)特的后處理方法應(yīng)用于集群仿真,以改善長期風(fēng)力發(fā)電量和下游尾流預(yù)測。這種新方法允許在不運(yùn)行模擬的情況下對海上風(fēng)電場的電力和下游尾流進(jìn)行多年和年代際估計。雖然先前的研究已經(jīng)對下游風(fēng)電場尾流進(jìn)行了小規(guī)模檢查,但這是通過提供精確和快速的長期預(yù)測來提高風(fēng)電場位置知識來減少這些尾流的第一個工具。
通過將這種方法應(yīng)用于兩個案例研究區(qū)域,該團(tuán)隊表明,雖然花費(fèi)了不到2%的計算工作量,但提出的長期預(yù)測與一年的WRF模擬非常一致。當(dāng)對風(fēng)速進(jìn)行分組時,結(jié)果是最精確的。
GraphCast:提供高效的中程全球天氣預(yù)報
從挑選服裝到颶風(fēng)發(fā)生時該怎么做,人們不斷根據(jù)天氣預(yù)報調(diào)整計劃。人們依靠氣象部門每天發(fā)布多達(dá)四次的“中程”天氣預(yù)報來做出需要了解未來十天天氣的決策。
DeepMind和谷歌最近的一項(xiàng)研究引入了GraphCast。這種基于 ML 的新型天氣模擬器超越了世界上最精確的確定性操作中程天氣預(yù)報系統(tǒng)和所有 ML 基線。GraphCast 自回歸模型使用來自歐洲中期天氣預(yù)報中心 (ECMWF) 的 ERA5 再分析檔案的氣象數(shù)據(jù)進(jìn)行訓(xùn)練。該模型建立在神經(jīng)圖網(wǎng)絡(luò)和新穎的高分辨率多尺度網(wǎng)格表示之上。它在赤道的分辨率約為25×25公里,可以每隔10小時為五個表面和六個大氣變量創(chuàng)建6天的預(yù)報,每個表面和六個大氣變量在37個垂直壓力水平。
在 90.0% 的 2760 個變量和提前期組合中,GraphCast 的表現(xiàn)優(yōu)于 ECMWF 的確定性運(yùn)營預(yù)測方法 HRES。對于它報告的 252 個目標(biāo)中的 99.2%,GraphCast 的表現(xiàn)優(yōu)于之前最準(zhǔn)確的基于 ML 的天氣預(yù)報模型。借助 Cloud TPU v4 技術(shù),GraphCast 可以在 60 秒內(nèi)生成 10 天的預(yù)測(35 GB 數(shù)據(jù))。
與更傳統(tǒng)的預(yù)測技術(shù)不同,隨著更多數(shù)據(jù)可用于訓(xùn)練,基于 ML 的預(yù)測可能很容易在規(guī)模和復(fù)雜性上增加。這項(xiàng)研究是基于ML的天氣建模的重大進(jìn)展。原則上,它可以應(yīng)用于更廣泛的環(huán)境和其他地理 - 空間 - 時間預(yù)測挑戰(zhàn),例如對各種氣象因素以及季節(jié)和氣候預(yù)測,野火,森林砍伐等進(jìn)行建模。
WeatherFusionNet用于從衛(wèi)星數(shù)據(jù)預(yù)測降水
深度學(xué)習(xí)方法最近提高了天氣預(yù)報的準(zhǔn)確性。布拉格捷克技術(shù)大學(xué)的研究人員在 2021 年人工智能惠及人類世界峰會挑戰(zhàn)賽上展示了兩種深度學(xué)習(xí)模型,用于預(yù)測極端天氣的發(fā)生。
第一個模型sat2rad是基于U-Net的深度學(xué)習(xí)模型,用于估計當(dāng)前衛(wèi)星幀時間步的降雨量。該模型使用卷積神經(jīng)網(wǎng)絡(luò)的空間不變性預(yù)測整個衛(wèi)星區(qū)域的降雨量,即使雷達(dá)數(shù)據(jù)僅適用于較小的區(qū)域。sat2rad模型分別應(yīng)用于所有四個衛(wèi)星幀以生成四個通道。
第二個模型PhyDNet是一個遞歸卷積網(wǎng)絡(luò),它將物理動力學(xué)與補(bǔ)充視覺輸入分開。PhyDNet的兩個分支處理物理動力學(xué)和殘差信息以進(jìn)行未來預(yù)測。由于比賽限制,PhyDNet接受了衛(wèi)星數(shù)據(jù)而不是雷達(dá)框架的訓(xùn)練。為了進(jìn)行預(yù)測,另一個U-Net將兩個模型的輸出與輸入序列合并。
該研究表明,使用sat2rad和PhyDNet模型可以增加降雨預(yù)測。卷積神經(jīng)網(wǎng)絡(luò)的空間不變性有助于估計整個衛(wèi)星區(qū)域的降雨量,即使雷達(dá)數(shù)據(jù)僅適用于較小的區(qū)域。
WF-UNet:用于降水臨近預(yù)報的天氣融合UNet
在設(shè)計針對惡劣天氣及其后果(如城市洪水或山體滑坡)的預(yù)警系統(tǒng)時,必須對降水進(jìn)行準(zhǔn)確的短期預(yù)報(臨近預(yù)報)。臨近預(yù)報有多種環(huán)境用途,從農(nóng)業(yè)管理到改善航空安全。
馬斯特里赫特大學(xué)和烏得勒支大學(xué)之間的合作研究探討了使用UNet核心模型以及該模型的擴(kuò)展來提前三小時預(yù)測西歐降雨量的可行性。他們的研究提出了天氣融合UNet(WF-UNet)模型,該模型建立在Core 3D-UNet模型的基礎(chǔ)上,在訓(xùn)練過程中包括風(fēng)速和降水等變量,然后分析這些因素如何影響預(yù)測降水的目標(biāo)任務(wù)的性能。
使用來自歐盟地球觀測計劃哥白尼的 ERA5 數(shù)據(jù)集,該團(tuán)隊編制了 14 個歐洲國家六年(2016 年 1 月至 2021 年 12 月)的降水和風(fēng)雷達(dá)圖像,時間分辨率為 1 小時,空間分辨率為 31 平方公里.他們將提出的 WF-UNet 模型與持久性模型和其他使用單一降水雷達(dá)輸入數(shù)據(jù)訓(xùn)練的基于 UNet 的架構(gòu)進(jìn)行了比較。根據(jù)調(diào)查結(jié)果,當(dāng)時間范圍為 1、2 和 3 小時時,WF-UNet 的 MSE 分別比分析的其他最佳性能設(shè)計低 22%、8% 和 6%。與傳統(tǒng)的 UNet 模型相比,決策級融合在捕獲存檔雷達(dá)圖像中包含的時空信息方面更勝一籌。由于其卓越的特征提取能力,WF-UNet 在短期臨近預(yù)報方面優(yōu)于其他經(jīng)過測試的基于 UNet 的模型。
這項(xiàng)研究的所有功勞都?xì)w功于這個項(xiàng)目的研究人員。
相關(guān)學(xué)術(shù)文章與鏈接:
1. https://arxiv.org/pdf/2210.12137.pdf
2. https://arxiv.org/abs/2212.14160
3. https://arxiv.org/pdf/2211.16824.pdf
4. https://arxiv.org/pdf/2211.02556.pdf
5. https://arxiv.org/pdf/2212.12794.pdf
6. https://arxiv.org/pdf/2301.10343.pdf
7. https://arxiv.org/pdf/2302.04102.pdf
8. https://arxiv.org/pdf/2302.05886.pdf
9. https://search.zeta-alpha.com/tags/68633
翻譯工具
1. Google Translate
2. Immersive Translate
水平有限,翻譯如有不當(dāng),請見諒!
作者:塔努什里·申外
- 上一篇:沒有啦
- 下一篇:促進(jìn)氣象產(chǎn)業(yè)發(fā)展的對策研究(二) 2023/3/1