作者:記者 張思瑋 來源: 發(fā)布時間:2020-9-13 6:37:43
解碼數(shù)據(jù) 潛心繪海
——記海洋人工智能與大數(shù)據(jù)中心

   海洋就像一個未被發(fā)掘的寶藏,靜靜地等待我們來開啟;海洋也像一本記載著豐富知識的書,等待著我們去閱讀;海洋更像是一本密碼集,等待著我們去破譯她的密碼,揭開她神秘的面紗。

   而要想破譯密碼,離不開海洋科學的大數(shù)據(jù)作為堅強“后盾”。

   “隨著信息技術的發(fā)展,數(shù)據(jù)已經(jīng)成為科學研究中像實驗室試管、燒杯一樣的常用工具,F(xiàn)代海洋科學具有研究目標宏大、多學科交叉的大科學特點,越來越依賴于系統(tǒng)的、高可信度的基礎科學數(shù)據(jù)及其衍生的數(shù)據(jù)產(chǎn)品。”海洋所海洋大數(shù)據(jù)中心主任李富超研究員說。

   由于海洋的特殊性,獲取數(shù)據(jù)資源的方式也是多樣的,有觀測數(shù)據(jù)、模式數(shù)據(jù),還有實驗數(shù)據(jù)。而這些資源,數(shù)據(jù)量大、格式標準不一樣、應用場景也多樣,給海洋數(shù)據(jù)的管理、應用帶來了很大的挑戰(zhàn)。并且,海洋數(shù)據(jù)還存在著封閉化、碎片化等嚴重的問題,跨學科的數(shù)據(jù)融合、數(shù)據(jù)綜合集成應用仍有待突破,人工智能等前沿技術在海洋科學數(shù)據(jù)中應用不足。

   鑒于此,建設一個開放共享的綜合性海洋大數(shù)據(jù)中心,是現(xiàn)代海洋科學發(fā)展的迫切需求。

 

厚積薄發(fā) 水到渠成

 

   早在2000年,海洋所就開始進行系統(tǒng)性的海洋科學數(shù)據(jù)庫建設工作。依托科技部基礎數(shù)據(jù)共享平臺建設項目,海洋所迎頭而上,聯(lián)合中國海洋大學等5家高校和科研院所建成“青島海洋科學數(shù)據(jù)平臺”,開展海洋科學數(shù)據(jù)整合和共享工作。

   自“十五”開始,在中科院信息化專項支持下,海洋所又系統(tǒng)開展了海洋科學數(shù)據(jù)資源庫、管理平臺、數(shù)據(jù)資源服務體系建設工作。

   不經(jīng)歷風雨,怎能見彩虹。正是基于上述彌足珍貴的實踐經(jīng)驗, 2018年,當中科院開始籌建海洋大科學研究中心時,海洋所整合相關資源,新成立了海洋大數(shù)據(jù)中心,成為大科學中心三個核心開放支撐平臺之一。

   據(jù)李富超介紹,該中心負責統(tǒng)籌運行研究所的高性能計算環(huán)境,集聚多源數(shù)據(jù)建設海洋大數(shù)據(jù)資源庫,發(fā)展人工智能等海洋數(shù)據(jù)關鍵技術,研發(fā)有國際影響力的數(shù)據(jù)產(chǎn)品,支撐海洋科學研究,保障海洋環(huán)境安全,服務社會經(jīng)濟發(fā)展。

 

海量數(shù)據(jù) 超算助力

 

   海洋大數(shù)據(jù)中心成立了,那么數(shù)據(jù)從何而來?

   這要追溯到1950年,海洋所成立伊始就將海洋調查作為重要基礎性工作之一,1953年開展了北黃海煙臺、威海漁場調查,這是新中國第一次海洋調查。1958年又作為骨干力量參加了第一次全國海洋綜合調查。以此為起點,海洋所承擔了大量從近海到深海大洋的調查任務,構建了從近海到大洋的海洋觀測網(wǎng)絡,逐步積累了海量海洋科學數(shù)據(jù)資源。目前,該中心的數(shù)據(jù)資源量已近300TB。

   有了數(shù)據(jù)采集途徑,也獲得了海量數(shù)據(jù),這還遠遠不夠,如何將這些數(shù)據(jù)轉化成產(chǎn)品,才能真正發(fā)揮數(shù)據(jù)的效能。這個過程,離不開高性能計算平臺保障。海洋大數(shù)據(jù)中心的超算平臺是中科院高性能計算環(huán)境青島分中心,其在數(shù)據(jù)管理和應用方面發(fā)揮了巨大作用。

   數(shù)據(jù)的質量控制是數(shù)據(jù)中心的重要工作內容之一,只有經(jīng)過嚴格質控的數(shù)據(jù)才是有效可用的數(shù)據(jù)。為此,海洋大數(shù)據(jù)中心在成立當年就加入國際數(shù)據(jù)質量控制海洋數(shù)據(jù)集(IQuOD)計劃,并建成唯一中國服務節(jié)點,高起點、高標準進行數(shù)據(jù)質控,為全球海洋科研工作者提供高質量海洋科學數(shù)據(jù)服務。

   面對人工智能技術在各領域遍地開花的局面,海洋大數(shù)據(jù)中心從美國引進高層次人才,從中科院內雙拼高端人才,組建了海洋人工智能和大數(shù)據(jù)分析、產(chǎn)品研發(fā)隊伍。圍繞圖像分類與目標檢測,研發(fā)出適合于海洋遙感影像的深度學習模型,在內波提取、海岸帶水淹區(qū)域制圖等典型應用進行性能驗證,相關成果在National Science Review上發(fā)表。

   在國家重點研發(fā)計劃全球變化及應對專項支持下,海洋大數(shù)據(jù)中心與科研人員合作研發(fā)了一系列高水平海洋科學數(shù)據(jù)產(chǎn)品。其中與中科院大氣所合作研制并發(fā)布全球海洋溫度格點數(shù)據(jù),被美國國家大氣中心氣候數(shù)據(jù)庫收錄,并成為國內首個被IPCC報告使用的海洋氣候監(jiān)測時間序列。

   此外,在中科院A類先導專項“地球大數(shù)據(jù)”支持下,該中心還與科研人員合作開發(fā)了CASEarth-Ocean數(shù)據(jù)可視化服務系統(tǒng),在我國近海滸苔綠潮、溢油、風暴潮災害預警服務等方面提供有效支撐。

 

培養(yǎng)海洋大數(shù)據(jù)的解碼者

 

   海洋大數(shù)據(jù)中心的運作需要專業(yè)的人做專業(yè)的事。

   目前,數(shù)據(jù)中心人員背景包括海洋地質、海洋生態(tài)、海洋遙感、物理海洋等海洋科學和計算機科學領域。“下一步,我們將著重引進、培養(yǎng)人工智能和大數(shù)據(jù)與海洋科學融合的復合型人才,并將信息領域一些新技術如人工智能,充分應用于海洋大數(shù)據(jù)中心建設。”李富超表示。

   同時,數(shù)據(jù)中心還設置了海洋數(shù)據(jù)資源建設與共享服務組、海洋人工智能與大數(shù)據(jù)技術組、海洋數(shù)據(jù)產(chǎn)品研發(fā)與應用組、海洋大數(shù)據(jù)中心保障組,將同科研人員深度融合建設研究型數(shù)據(jù)中心,引領人工智能海洋學研究方向。

   不過,坦白地說,目前全球科學家對整個海洋的認識還不足5%。也就是說,現(xiàn)有的海洋的大數(shù)據(jù),或許僅僅只是“冰山一角”。

   未來,該中心將鞏固和拓展數(shù)據(jù)資源持續(xù)獲取途徑,形成完備的海洋數(shù)據(jù)資源體系,并持續(xù)完善數(shù)據(jù)匯交、共享體系,這也是大數(shù)據(jù)中心的一個“發(fā)力點”。

   李富超表示,最近海洋大數(shù)據(jù)中心剛獲批中科院海洋科學數(shù)據(jù)中心,未來他們將繼續(xù)堅持目標導向,打造海洋科學大數(shù)據(jù)資源管理、質控、分析、應用、共享的“生態(tài)圈”,助力海洋科學研究新范式形成,推動海洋信息產(chǎn)業(yè)發(fā)展。

 

 

《科學新聞》 (科學新聞2020年8月刊 平臺)
發(fā)E-mail給:      
| 打印 | 評論 |