5月27日,2023中國國際大數據產業博覽會“數據要素流通與價值化”論壇舉行。華為公司數據總架構師馬運作題為《華為數據要素流通探索與實踐》的主題發言。
(相關資料圖)
數據流通最簡單的模式就是系統跟系統集成對接,是數據IT的一部分。第二個比較流行的方式是數據匯聚,數據匯聚到中臺然后再共享出去,這在企業內部是非常流行的。第三個是隨著數據成為生產要素是有價值的,這時候就不能隨便共享了,就走到了數據交換,數據交換一定是有合約的。這是三個大的階段。
從華為整個數據工作的歷程來講也跟這個相匹配。華為第一個階段是數據清潔,關鍵是要建一套體系,能夠保證你的數據從定義到使用都是按照一定的規則進行的。我們公司有總綱,有架構標準、有組織、有流程、有IT。
第二個階段,在業務數字化的基礎上,數據散落在各個交易系統中,華為有3000多個系統,這時候把重要的業務數據入到數據湖里,然后再加工做個服務開放出去,這是我們做的第二階段,做了五年,這里面有數據湖,有T+N的。在華為的數據之道這本書里面有介紹。
第三階段,范圍擴大了,不光是企業內部的共享,要跟供應商、客戶、其他組織進行交換。華為這么大的一個企業全球經營,我們內部也有各種數據交換,也有主體,一定要解決數據清算和交換的問題。怎么解決呢?我們認為數據流通、數據交換最關鍵的一個問題就是要解決數據的兩個特征,一個是非排他性,其他生產要素都是可以排他的,你可以用,他也可以用,第二是數據的復制是零成本的,你不解決非排他性和零成本復制的問題,數據流通做不起來,我不愿意把數據給出去,給出去了數據價值一下就沒了。我們在可信可控可證的基礎上建立企業數據空間EDS的生態。
華為有幾個關鍵設計,第一個是使用控制。要做到誰在什么時間,用什么APP,在什么地點,使用幾次,做什么事情都能夠控制,而且在程序上控制,不是在簽約上控制,這是第一個非常關鍵的,做不到這個數據流通會受到限制。
第二個是在整個數據交換過程中,它跟一般的集成不一樣,首先有數據交換的資源。資源對數據進行切片,然后分裝,按照一定的格式轉換,變成數據交換的單元。交換單元是傳輸、驗收、清算的最小單元,幾個交換單元合起來,再加上使用控制,比如你的數據可以使用一個月,這時候再加上我的定價。然后再是合約,合約就是兩方,咱們商定好這個數據,然后用什么交付方式,怎么驗收,怎么支付,這是一個完整的過程。
第三個是清算,清算是清算方一定要注冊,然后我在不同的數據流通方式,我都要上報,上報了以后就可以對它進行統計核對,這時候每個主體都能夠清楚知道,我持有什么數據,獲得什么數據,加工了什么數據,我給了別人什么數據,這是一個清算。
第四個是查證追溯,所有的交易過程都有探針。
第五個是安全可信連接器設計,這個使用控制,我是通過一個殼控制的,通過數據連接器,有不同的安全等級,最簡單的我是在應用層控制。第二個環境級的,Trust的連接器,我還能對環境進行控制。第三個是硬件級的,我的使用控制不光在應用層,我可以在系統操作層,在存儲層可以刪掉,這個數據不出集群,我在存儲層控制,它出不去。不同的業務需求可以有不同的安全連接器。
第六個是消費APP可控接入設計,針對不同類型的數據增值APP,提供三種差異化的APP接入能力。本身一個APP是帶存儲的,我們也有方法做一些改造,讓它受我的控制策略的影響,最難的就是SaaS這種APP,它本身是一個平臺,這時候我們要用虛擬內存的方式進行對接,這樣我們就能夠控制數據的使用。
我們設計的這一套是去中心化的數據空間,一定要有一個標準的框架。你清算的標準、使用控制的標準、資源的描述、接入認證等等需要互認、互操作,這時候我們積極參與。信通院也非常有研究的,信通院組織的國家標準的制定,還有歐盟的IDS、GAIA-X這些標準制定,我們爭取做到在底層是能夠互認互通的。
記者 楊阿敏/文 數據觀/圖
責任編輯:Rex_27