■薛菁華 陳廣玉
【編者按】隨著新一代信息技術(shù)的飛速發(fā)展,海量的大數(shù)據(jù)已經(jīng)成為國家重要的基礎(chǔ)性戰(zhàn)略資源,引領(lǐng)著新一輪的科技創(chuàng)新。日前發(fā)布的《數(shù)字中國建設(shè)整體布局規(guī)劃》高度重視公共數(shù)據(jù)的作用,提出推動公共數(shù)據(jù)匯聚利用,建設(shè)公共衛(wèi)生、科技、教育等重要領(lǐng)域國家數(shù)據(jù)資源庫。《上海市全面推進城市數(shù)字化轉(zhuǎn)型“十四五”規(guī)劃》強調(diào)“數(shù)字化將不斷催生科技創(chuàng)新新范式”是正在發(fā)生的重要趨勢之一。
傳統(tǒng)的科研范式面臨數(shù)字化轉(zhuǎn)型的需要。厘清科研范式發(fā)展及數(shù)字化轉(zhuǎn)型的過程,摸清上海家底,有助于幫助上海在關(guān)鍵科研領(lǐng)域?qū)崿F(xiàn)突破,進而在全球的科技博弈中贏得戰(zhàn)略主動。《文匯智庫》特刊發(fā)入選2022年《上海智庫報告》的市科委軟科學(xué)研究項目“科研范式數(shù)字化轉(zhuǎn)型國內(nèi)外對標與實施路徑研究”部分研究成果,以饗讀者。
(資料圖片僅供參考)
科學(xué)發(fā)展的本質(zhì)就是科研范式的變革過程
范式(paradigm)的概念最早由美國科學(xué)史學(xué)家托馬斯·塞繆爾·庫恩(Thomas Samuel Kuhn)提出,是指科學(xué)共同體成員共同接受的理論體系,是把握研究對象的一種思維方法。范式一旦轉(zhuǎn)變,科學(xué)家思考問題和觀察世界的方法亦會隨之改變。而科研范式是指科學(xué)共同體為了使日常科研工作高效有序運轉(zhuǎn)所普遍采用的一套規(guī)則體系的集合,涉及建制環(huán)境、研究路徑、評價體系、研究方法、研究工具、技術(shù)路線與研究模式等要素,它會受到社會、經(jīng)濟、文化、國際環(huán)境以及個體偏好等因素的影響。簡單來講,范式影響科研范式的選擇,當兩者相匹配時,科技創(chuàng)新活動會呈現(xiàn)出活躍而高產(chǎn)的狀態(tài),反之亦然。
科學(xué)發(fā)展的本質(zhì)就是“科學(xué)革命”的過程,也是科研范式形成、確定、危機、變革和更新的過程。新范式的產(chǎn)生,一方面是因為范式本身的發(fā)展,另一方面是由于外部環(huán)境的推動。隨著信息技術(shù)日新月異、顛覆性技術(shù)層出不窮、社會環(huán)境快速變化,傳統(tǒng)的科研范式受到大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、云計算等新一代信息技術(shù)的影響,科學(xué)研究的思維、方法和過程也面臨著巨大的挑戰(zhàn)。因此,科研范式的數(shù)字化轉(zhuǎn)型是科學(xué)技術(shù)發(fā)展的結(jié)果,而把握科研范式數(shù)字化轉(zhuǎn)型則將大大推動多學(xué)科融合發(fā)展,提高科學(xué)新發(fā)現(xiàn)的機會,提升上海科技創(chuàng)新的活力,為上海參與世界前沿科技攻關(guān),解決科技創(chuàng)新“卡脖子”問題做好準備。
科研范式的數(shù)字化轉(zhuǎn)型主要集中在數(shù)據(jù)密集型科學(xué)和開放科學(xué)兩個階段。2007年,在美國國家科學(xué)研究委員會計算機科學(xué)與電信委員會(NRC-CSTB)組織召開的會議上,圖靈獎得主、關(guān)系型數(shù)據(jù)庫鼻祖吉姆·格雷(Jim Gray)發(fā)表了題為“第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”的主題演講,在經(jīng)驗科學(xué)、理論科學(xué)、計算科學(xué)三大范式之后,提出了基于數(shù)據(jù)密集型計算的科學(xué)研究第四范式。第四范式實現(xiàn)了由傳統(tǒng)的假設(shè)驅(qū)動向數(shù)據(jù)驅(qū)動的轉(zhuǎn)變,完成了科研范式的數(shù)字化轉(zhuǎn)型。
步入大數(shù)據(jù)時代,數(shù)據(jù)密集型科學(xué)迎來再發(fā)展階段,其研究對象、研究內(nèi)容進一步延伸,在數(shù)字技術(shù)的基礎(chǔ)上,研發(fā)活動向網(wǎng)絡(luò)化、生態(tài)化方向發(fā)展,開源開放、知識共享成為新趨勢,進而催生出一種更強調(diào)包容與合作的新范式——開放科學(xué)。2019年和2021年,經(jīng)濟合作與發(fā)展組織(OECD)以及聯(lián)合國教科文組織(UNESCO)相繼在各自的政策文本中表達了“開放科學(xué)是科學(xué)研究新范式”的類似觀點。開放科學(xué)是科學(xué)研究受到數(shù)字化轉(zhuǎn)型影響而產(chǎn)生的一種新范式,旨在實現(xiàn)人人皆可公開使用、獲取和重復(fù)使用科學(xué)知識,增進科學(xué)合作和信息共享,并向科學(xué)界以外的社會行為者開放科學(xué)知識的創(chuàng)造、評估和傳播進程。開放獲取、開放數(shù)據(jù)和開放協(xié)作是開放科學(xué)的三大關(guān)鍵要素。
推動科研范式數(shù)字化轉(zhuǎn)型,關(guān)鍵在科學(xué)數(shù)據(jù)管理
隨著信息技術(shù)的快速發(fā)展和信息獲取能力的不斷提升,全球科技創(chuàng)新已進入以大數(shù)據(jù)為驅(qū)動的數(shù)據(jù)密集型科研范式以及追求科學(xué)過程高透明、高品質(zhì)和高參與性的開放科學(xué)范式。無論是數(shù)據(jù)密集型科學(xué)還是開放科學(xué),科學(xué)數(shù)據(jù)都是核心要素。數(shù)據(jù)密集型科學(xué)最典型的特點便是對海量數(shù)據(jù)進行挖掘和分析,可以說,數(shù)據(jù)密集型科學(xué)因數(shù)據(jù)而起源,由數(shù)據(jù)計算而產(chǎn)生,并依托各項數(shù)據(jù)的分析與應(yīng)用而不斷發(fā)展。開放科學(xué)的關(guān)鍵要素中同樣涉及科學(xué)數(shù)據(jù),即開放數(shù)據(jù)。海量科學(xué)數(shù)據(jù)對生命科學(xué)、天文學(xué)、空間科學(xué)、地球科學(xué)、物理學(xué)等多個學(xué)科領(lǐng)域的科研活動帶來了沖擊性的影響,科技創(chuàng)新越來越依賴于科學(xué)數(shù)據(jù)的綜合分析。因此,要用好科學(xué)數(shù)據(jù),進一步推動科研范式的數(shù)字化轉(zhuǎn)型,關(guān)鍵在于科學(xué)數(shù)據(jù)管理。
當前,科學(xué)數(shù)據(jù)已成為全球科學(xué)系統(tǒng)基礎(chǔ)設(shè)施的重要組成部分。由于科學(xué)數(shù)據(jù)具有學(xué)科領(lǐng)域分布廣泛、數(shù)據(jù)結(jié)構(gòu)多樣、數(shù)據(jù)共享困難等特點,科學(xué)數(shù)據(jù)管理的研究和實踐活動對整個社會、科研機構(gòu)或者科研人員來說都具有重要意義。近年來,發(fā)達國家不斷加大科學(xué)數(shù)據(jù)開放共享的步伐。例如,美國國家科學(xué)基金會(NSF)在2022年9月宣布,計劃建立國家級的數(shù)據(jù)基礎(chǔ)設(shè)施“開放知識網(wǎng)絡(luò)”(OKN),進一步擴大科學(xué)數(shù)據(jù)的開放共享及參與研究的機會,支持21世紀科學(xué)數(shù)據(jù)和下一代人工智能的發(fā)展,以應(yīng)對美國面臨的復(fù)雜的國家挑戰(zhàn)。
科學(xué)數(shù)據(jù)資源的妥善使用和管理,既關(guān)乎我國科研力量和進步,也關(guān)乎國家安全。我國在科學(xué)數(shù)據(jù)管理方面長期以來都是實踐先于政策。2018年出臺的《科學(xué)數(shù)據(jù)管理方法》是首次在國家層面釋放出開放為主的科學(xué)數(shù)據(jù)管理信號。在科研范式數(shù)字化轉(zhuǎn)型過程中,我們特別要對可能面臨的問題加以警惕,如科學(xué)數(shù)據(jù)大量流入國外數(shù)據(jù)庫,科研人員過度依賴國外數(shù)據(jù)庫等。《數(shù)字中國建設(shè)整體布局規(guī)劃》高度重視公共數(shù)據(jù)的作用,提出“構(gòu)建國家數(shù)據(jù)管理體制機制,健全各級數(shù)據(jù)統(tǒng)籌管理機構(gòu)”,并強調(diào)“增強數(shù)據(jù)安全保障能力”。
上海推動科研范式數(shù)字化轉(zhuǎn)型的優(yōu)勢與路徑
全面推進城市數(shù)字化轉(zhuǎn)型,加快建設(shè)具有世界影響力的國際數(shù)字之都,是上海的堅定目標。在此背景下,上海推動科研范式數(shù)字化轉(zhuǎn)型勢在必行。作為我國經(jīng)濟發(fā)展最活躍、開放程度最高、創(chuàng)新能力最強的城市之一,上海一直致力于建設(shè)具有全球影響力的科創(chuàng)中心,這為上海推動科研范式實現(xiàn)數(shù)字化轉(zhuǎn)型奠定了基石。
第一,創(chuàng)新主體不斷向科學(xué)最前沿和技術(shù)最前端發(fā)起挑戰(zhàn),成為推動上海科研范式數(shù)字化轉(zhuǎn)型的有力引擎。在滬高校創(chuàng)新策源能力全國領(lǐng)先;國家實驗室、中科院在滬院所、新型研發(fā)機構(gòu)及各類平臺不斷發(fā)揮自身特色,加速推進科技創(chuàng)新;企業(yè)主體圍繞科技創(chuàng)新不斷發(fā)力,民營企業(yè)迸發(fā)出前所未有的科技創(chuàng)新活力。這些具有研發(fā)實力和能力的創(chuàng)新主體,對科研范式數(shù)字化轉(zhuǎn)型都有非常迫切的需求,將成為上海科研范式數(shù)字化轉(zhuǎn)型的有力推動者。
第二,創(chuàng)新能力穩(wěn)步提升在國內(nèi)外取得重要影響力,成為推動上海科研范式數(shù)字化轉(zhuǎn)型的重要實力保障。上海已初步形成世界級大科學(xué)設(shè)施集群,集聚了以國家實驗室為引領(lǐng)的330余家國家級研發(fā)機構(gòu),在用在建同步輻射光源、硬X射線裝置等14個國家重大科技基礎(chǔ)設(shè)施,設(shè)施數(shù)量、投資額和建設(shè)進度均全國領(lǐng)先。與此同時,上海科研人員在腦科學(xué)、量子科技、納米材料、基因與蛋白等領(lǐng)域取得一批具有國際影響力的原創(chuàng)成果。這些都是上海創(chuàng)新能力在硬件和軟件方面獲得顯著提升的有力證明,也成為上海科研范式數(shù)字化轉(zhuǎn)型能得以實現(xiàn)的重要實力保障。
第三,創(chuàng)新環(huán)境不斷優(yōu)化加速創(chuàng)新要素不斷集聚,成為推動上海科研范式數(shù)字化轉(zhuǎn)型的堅實后盾。上海在科創(chuàng)人才引育、金融支持科創(chuàng)、知識產(chǎn)權(quán)保護、開放協(xié)同創(chuàng)新、創(chuàng)新創(chuàng)業(yè)扶持、科技體制改革等重點領(lǐng)域,持續(xù)加大政策支持力度,吸引聚集科技創(chuàng)新要素,不斷優(yōu)化創(chuàng)新生態(tài)環(huán)境。這些舉措極大地優(yōu)化了上海科技創(chuàng)新的整體環(huán)境,為上海科研范式實現(xiàn)數(shù)字化轉(zhuǎn)型,并不斷催生新的科研范式提供肥沃的土壤。
科學(xué)數(shù)據(jù)管理是上海科研范式數(shù)字化轉(zhuǎn)型的地基。為了打好這一地基,上海亟待在以下方面加以突破:
在頂層設(shè)計方面,抓緊出臺地方政策。上海可抓住全市數(shù)字化轉(zhuǎn)型的契機,從開放性、規(guī)范性、安全性等角度出發(fā),適時研究各地、各領(lǐng)域的科學(xué)數(shù)據(jù)管理規(guī)則、標準與共享規(guī)范,盡快出臺上海科學(xué)數(shù)據(jù)管理的地方細則。
在支持方向方面,注意優(yōu)勢領(lǐng)域齊抓并舉。上海可用軟硬件齊抓并舉的思路,加快推進科研范式數(shù)字化轉(zhuǎn)型。一是建設(shè)一支由高校、科研機構(gòu)、企業(yè)研發(fā)部門、出版機構(gòu)、大科學(xué)裝置、研發(fā)基地、數(shù)據(jù)中心、科技情報機構(gòu)等不同領(lǐng)域的專家組成的高級專家團隊,為上海實現(xiàn)科研范式數(shù)字化轉(zhuǎn)型出謀劃策。二是了解上海科研優(yōu)勢領(lǐng)域相關(guān)機構(gòu)對于數(shù)字化轉(zhuǎn)型的需求,加速推進領(lǐng)域內(nèi)科研范式數(shù)字化轉(zhuǎn)型的進程。三是重視上海研發(fā)基地、研發(fā)平臺和大科學(xué)裝置的數(shù)據(jù)存算能力設(shè)施建設(shè)。
在基礎(chǔ)設(shè)施方面,加緊落實存算一體平臺。科研活動專業(yè)性極強,科研數(shù)據(jù)對于保存、分析和利用的要求也相對較高,一般商業(yè)云無法滿足對科研活動的支撐,因此有必要為科研工作者打造一朵具有存算一體和海量資源開放共享功能的科研“云”。
在人才培養(yǎng)方面,加快建立人才培養(yǎng)體系。數(shù)字化轉(zhuǎn)型帶來的最大挑戰(zhàn)是數(shù)字化人才的短缺。應(yīng)不斷提高上海科技工作者的數(shù)字素養(yǎng),為上海的科技創(chuàng)新提供有力的數(shù)字技術(shù)支撐。可借鑒歐美等發(fā)達國家和地區(qū)的經(jīng)驗,一是在高校開設(shè)“科學(xué)數(shù)據(jù)管理課程”,引入數(shù)據(jù)教育長期計劃,系統(tǒng)化培養(yǎng)數(shù)據(jù)管理人才。二是為科研工作者開設(shè)短期的數(shù)據(jù)管理培訓(xùn)課程,提升科研人員的數(shù)字素養(yǎng)。
在機制保障方面,敢于突破相關(guān)體制機制。現(xiàn)階段可以從科研經(jīng)費預(yù)算設(shè)置和專業(yè)人員配備兩個方面進行突破,打破傳統(tǒng)的固有做法,為上海科技創(chuàng)新營造積極向上、健康有序的科研環(huán)境。第一,進一步明確科研經(jīng)費預(yù)算編制科目中有關(guān)科研云的租賃費用以及相關(guān)科學(xué)數(shù)據(jù)處理費用的支出依據(jù)。第二,解決高校及科研機構(gòu)缺乏數(shù)字設(shè)備運維及數(shù)字技術(shù)支持的專業(yè)人員的問題。
[作者分別為上海圖書館(上海科學(xué)技術(shù)情報研究所)副研究員;正高級工程師]
相關(guān)鏈接
科學(xué)研究四個范式
經(jīng)驗科學(xué)、理論科學(xué)、計算科學(xué)和數(shù)據(jù)密集型科學(xué)是科學(xué)研究的四個范式。
2007年,圖靈獎得主、關(guān)系型數(shù)據(jù)庫鼻祖吉姆·格雷(Jim Gray)在美國國家科學(xué)研究委員會計算機科學(xué)與電信委員會(NRC-CSTB)組織召開的會議上發(fā)表的題為“第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”的主題演講中指出:經(jīng)驗科學(xué)、理論科學(xué)、計算科學(xué)和數(shù)據(jù)密集型科學(xué)是科學(xué)研究的四個范式。
經(jīng)驗科學(xué)即第一范式,也稱為實驗科學(xué),指以實驗方法為基礎(chǔ)的科學(xué)研究模式,在研究方法上以歸納為主,主要模型是科學(xué)實驗。典型范例包括伽利略的動力學(xué)、牛頓的經(jīng)典力學(xué)、哈維的血液循環(huán)學(xué)等。
理論科學(xué)即第二范式,偏重于對理論的總結(jié)和概括,用模型、數(shù)學(xué)公式、算法等表示形式,在研究方法上以演繹法為主。理論科學(xué)的主要研究模型是數(shù)學(xué)模型,典型范例包括數(shù)學(xué)中的圖論、集合論、概率論、數(shù)論;物理學(xué)中的相對論、圈量子引力理論、弦理論等等。
計算科學(xué)即第三范式,是一個與數(shù)據(jù)模型構(gòu)建、定量分析方法以及利用計算機來分析和解決科學(xué)問題相關(guān)的研究領(lǐng)域,主要用于對各個學(xué)科中的問題進行計算機模擬和其他形式的計算。計算科學(xué)的主要研究模型是計算機仿真和模擬,其典型范例包括:熱力學(xué)、分子問題、人工智能和信號系統(tǒng)等。
數(shù)據(jù)密集型科學(xué)即第四范式,由傳統(tǒng)的假設(shè)驅(qū)動向基于科學(xué)數(shù)據(jù)進行探索的科學(xué)方法的轉(zhuǎn)變。數(shù)據(jù)密集型科學(xué)的主要研究模型包括機器學(xué)習(xí)與數(shù)據(jù)挖掘。其典型范例包括所有的大數(shù)據(jù)實踐場景,以及基于大數(shù)據(jù)的人工智能。
當前,全球科技創(chuàng)新已進入以大數(shù)據(jù)為驅(qū)動的數(shù)據(jù)密集型科研范式以及追求科學(xué)過程高透明、高品質(zhì)和高參與性的開放科學(xué)范式。
責(zé)任編輯:Rex_04