·據劉慶峰介紹,在單卡算力上,“星火一體機”對標英偉達A100,同時還正在和華為一道打造面向超大規模大模型訓練的國產算力集群,形成集群化優勢。
“科大訊飛和華為已在聯合攻關算力卡脖子的問題。”8月15日,科大訊飛董事長劉慶峰在合肥舉辦的訊飛星火認知大模型V2.0升級發布會上表示。會上,科大訊飛與華為共同發布用于構建專屬大模型的軟硬件一體化設備“星火一體機”。
(資料圖片僅供參考)
據劉慶峰介紹,在單卡算力上,這個平臺對標英偉達A100,同時還正在和華為一道打造面向超大規模大模型訓練的國產算力集群,形成集群化優勢。
大模型的研發過程,需要可以支撐千億參數規模大模型并行訓練的算力和框架,還需要幾千張芯片同時連續運行?;诖耍到y架構以及并行訓練的集群能力成為大模型研發的關鍵。
星火一體機的訓練和推理一體化部署,可用于問答系統、對話生成、知識圖譜構建、智能推薦等領域的應用,具備大模型預訓練、多模態理解與生成、多任務學習和遷移等能力。
星火一體機基于華為鯤鵬CPU+昇騰GPU,另外聯合華為存儲和網絡提供整機柜方案。圖片來源:科大訊飛
據悉,星火一體機基于華為鯤鵬CPU(中央處理器)+昇騰GPU(圖形處理器),另外聯合華為存儲和網絡提供整機柜方案,FP16(半精度浮點數格式)算力2.5 petaFLOPS(1 petaFLOPS為每秒運行一千萬億次浮點運算)。在大模型訓練中最為流行的英偉達DGX A100,其單節點包含8塊GPU,可以輸出5 PetaFLOPS的FP16算力。
上月,科大訊飛公布訊飛星火將與昇騰AI聯合,打造基于中國自主創新的通用智能新底座。一方面,訊飛星火認知大模型基于訓練推理一體化設計,實現大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業落地應用和迭代;另一方面,以昇騰AI為核心,軟硬件協同優化,構建算力集中、性能優越、供給穩定、數據安全的大模型訓練集群。
在當天的演講中,劉慶峰更為細致地講解道,“華為跟科大訊飛共同在昇騰AI的軟硬件平臺和軟件的支撐工具上,把高算力AI芯片、高性能的算子庫、多卡高速互聯以及分布式存儲結合起來,尤其是我們聯合針對人工智能所需要的最重要的算子庫進行甄別和打磨。然后在此基礎上,架構科大訊飛的訓練和數據閉環全流程設計,以及訓練和推理一體化設計的自研大模型訓練平臺,中間是支持大規模的異構算力兼容,也支持混合云架構易拓展,使得我們今天所看到的訊飛星火V2.0的演示以及所有產品,架構在安全可控的平臺上?!?
據悉,“訊飛星火認知大模型V2.0”除了持續提升通用能力基礎外,重點突破代碼能力和多模態交互能力。據劉慶峰介紹,在OpenAI構建的代碼能力的公開測試集HumanEval上,訊飛星火大模型V2.0基于Python和C++進行代碼寫作的能力接近ChatGPT水平,差距僅為1%和2%,預計將于今年10月24日全面超越ChatGPT,明年上半年將正式對標GPT-4。
目前,訊飛星火大模型擁有130億、650億和1750億3個版本的模型參數可選。圍繞星火大模型,科大訊飛正在構建開發者生態,目前有4000多個助手開發者團隊加入星火平臺。
責任編輯:Rex_16