(資料圖)
近日,LiveVideoStackCon2023上海站圓滿舉辦,近百位行業大咖齊聚大會,從AICG、元宇宙、多媒體、傳輸網絡等不同視角切入,覆蓋娛樂、醫療、安防、旅游、電商、社交、游戲、智能設備等行業領域,分享音視頻領域的當前技術發展,探討未來趨勢和前景。華為云媒體服務產品部多位專家受邀進行主題演講,帶來行業最新技術成果分享。
直播+X,突破時空限制,超越真實的內容體驗
華為云媒體服務產品部副總裁陸振宇在《直播+X,直播行業新趨勢》主題演講中,分享了直播行業對新技術的需求和應用;在現階段電商直播蓬勃發展、時空范圍不斷擴大、數字人直播盛行的大背景下,就華為云如何高質量地幫助客戶在全球化語境下開展業務,為全球客戶的業務提供服務展開了分享。
消費者在國內看視頻、直播的時候,本質上是用的一個國家的一張網,在此情況下,都能達到不錯的體驗調優效果;但放眼全球,多個國家地區千差萬別的網絡質量、條件和業務場景,要實現良好的交流體驗,構建一個分國家、分協議、自動化的數據驅動的調用系統很有必要。
華為在很多年前,就已經在為華為全球170多個國家的分支機構、消費者用戶提供會議、暢聯等實時音視頻服務。華為云通過全球一張網的規劃和落地,解決了本地覆蓋問題;通過多拓撲網絡平面選路算法,保障了跨區傳輸體驗;基于WebRTC的低時延分發算法,將E2E時延<500ms,保障跨大區互聯最優時延,確保用戶最佳體驗感;最后,通過流量級和應用級可視化、質量可視化、帶寬可視化,解決全球運維效率問題,助力伙伴全球業務開展。
隨著AIGC的發展,數字人直播盛行,如何在這個行業里服務好做業務創新的伙伴,降低算力成本和傳輸成本,以及如何降低技術使用門檻的問題。華為云的解決方案是MetaStudio數字內容生產線,通過模型制作、直播話術及一卡十路的能力,降低數字人直播入門門檻,解決有效運營及快速降本問題。
伙伴通過API方式接入使用,可以高性價比、高質量的制作數字人; 除了形象,還提供數字人預置音色、音色克隆、高保真音色克隆等音色服務; 除此之外,華為云通過昇騰的算力、算力之上的模型層、數字人算法、渲染、推流到直播平臺全套的解決方案,幫助用戶快速實現生成式直播。華為云MetaStudio,人人皆可擁有自己的個性化數字人
華為云虛擬數字人技術負責人李明磊分享《華為云MetaStudio多模態數字人進展及挑戰介紹》,對數字人建模、編輯、驅動進行技術解讀,深度闡述了數字人視頻制作、直播、交互的流程,以及介紹了華為云數字內容生產線MetaStudio提供的一系列基礎服務。提供數字人三種生成方式:
文字生成數字人:輸入對形象的描述,10s左右即可生成數字人,可以被后續驅動; 照片生成數字人:一張照片,一分鐘生成數字人; 視頻生成數字人:更多用于數字人直播場景,需要五分鐘語料,訓練3-6h,生成數字人形象。華為云MetaStudio,大大提升了數字人的生產制作效率,在傳統動捕方案之外,數字人單目驅動、數字人語音驅動表情和肢體、數字人情感風格肢體驅動讓數字人的使用更加簡單。
華為云渲染,助力渲染全場景業務遷移上云
華為云渲染服務技術專家陳普帶來《華為云渲染實踐》的演講分享。據分享,渲染場景分為離線渲染與實時渲染兩類場景。其中離線渲染場景主要用于影視、高清設計圖等渲染場景。
華為云離線渲染AI加速,幫助客戶在華為云的離線渲染業務提升渲染效率,顯著降低渲染資源消耗。華為云云原生光追渲染服務,提供豐富的材質兼容,幫助家裝設計類場景可以離線分鐘級出高清渲染圖,大幅度提升渲染效率。
實時渲染在數字人、數字人、虛擬展廳、工業等場景被廣泛使用。華為云3D應用實時云渲染結合華為實時音視頻服務,幫助企業將現有3D應用直接上云,客戶端無需高級硬件即可以獲得高質量流暢體驗。
華為云MetaEngine的實時渲染技術,支持物理真實的渲染、仿真、動畫能力; 實時光追渲染管線支持數字人、地形、水體、天氣、植被等豐富的場景渲染,滿足多場景制作的效果與性能,融合華為云多用戶復用技術,還能夠提升單機并發能力; 華為云工業圖形渲染引擎,可幫助CAD、CAE實現高性能工業可視化圖形渲染與光追真實感渲染。華為云媒體基礎設施通過一系列創新技術,解鎖更多新場景和新玩法,不斷拓寬視頻直播業務邊界,實現更實時、更沉浸式的互動體驗,重塑音視頻產業生產力,賦能音視頻產業新發展。
責任編輯:Rex_02