(資料圖片僅供參考)
騰訊首次披露行業(yè)大模型進(jìn)展:不追求參數(shù)高,希望成本預(yù)算可控
IT之家今日(6月20日)消息,6月19日,騰訊云行業(yè)大模型及智能應(yīng)用技術(shù)峰會(huì)在國(guó)家科技傳播中心召開,騰訊首次對(duì)外披露行業(yè)大模型研發(fā)進(jìn)展,發(fā)布依托騰訊云TI平臺(tái)打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),助力客戶構(gòu)建專屬大模型及智能應(yīng)用。
騰訊云還聯(lián)合多家客戶和生態(tài)伙伴,啟動(dòng)了行業(yè)大模型共建合作和生態(tài)計(jì)劃,推動(dòng)大模型在各個(gè)領(lǐng)域的創(chuàng)新應(yīng)用。基于騰訊 HCC 高性能計(jì)算集群和大模型能力,為傳媒、文旅、政務(wù)、金融等 10 余個(gè)行業(yè)提供超過 50 個(gè)大模型行業(yè)解決方案。
據(jù)澎湃新聞報(bào)道,騰訊此次發(fā)布的并非是 C 端通用大模型,而是落地于 B 端的產(chǎn)業(yè)大模型。對(duì)此,騰訊云副總裁吳運(yùn)聲解釋稱,對(duì)于 C 端通用大模型,騰訊內(nèi)部也有相關(guān)應(yīng)用,但目前尚不能對(duì)外公開相關(guān)信息。
吳運(yùn)聲還表示,基本在億級(jí)別參數(shù)以上的都可以稱為大模型,但規(guī)模參數(shù)越高,消耗的資源和成本也越相應(yīng)增加。行業(yè)大模型的核心在于根據(jù)客戶需求制定相關(guān)的模型參數(shù),而不是一味追求“規(guī)模大”或是“參數(shù)高”。在他看來(lái),隨著技術(shù)和算力的發(fā)展,大模型的參數(shù)規(guī)模也在不斷上漲,騰訊更關(guān)注怎么用更有效的方法、更低的成本去解決問題,而不是關(guān)注幾億、幾十億、幾百億還是一千多億這些數(shù)字。他舉例說,就像不同類型的運(yùn)動(dòng)員需要不同程度的體力訓(xùn)練一樣,不需要每個(gè)人都追求最高的參數(shù)規(guī)模。希望能以最低的成本、最合適的模型和最好的服務(wù)把大模型真正做好,會(huì)在預(yù)算和成本可控的情況下提供最符合邏輯的模型,讓其在場(chǎng)景中達(dá)到目的,解決問題。
吳運(yùn)聲還透露,目前騰訊云行業(yè)大模型能力已在騰訊企點(diǎn)、騰訊會(huì)議、騰訊云 AI 代碼助手等多款產(chǎn)品中落地使用。
通用大模型通常需要更高的參數(shù)規(guī)模和更強(qiáng)的算力支持,也更具有挑戰(zhàn)性和前瞻性。據(jù)悉,騰訊云此前發(fā)布了新一代高性能計(jì)算集群 HCC,采用英偉達(dá)最先進(jìn)的 H800 GPU 芯片,其算力超過旗艦芯片 A100 三倍,為大模型訓(xùn)練提供了強(qiáng)有力的保障。
責(zé)任編輯:Rex_20