圖片來源@視覺中國
(資料圖)
文 | 航通社,作者 | 書航
使用「文心一言」作畫時,它會讓你精準(zhǔn)給出 prompt,舉的例子是「幫我畫一枝晶瑩剔透的牡丹花」。我用「文心一格」畫了這個 prompt。
從我家到百度科技園,我單程需要跨越 66 公里,花費 3 個小時。去現(xiàn)場參加發(fā)布會絕對不是第一時間領(lǐng)略「文心一言」魅力的最佳方案。
實際上,在現(xiàn)場可以看到的內(nèi)容,和直播的內(nèi)容基本一致。在現(xiàn)場能看到的也是錄屏演示,沒有額外「加餐」。
當(dāng)我回到家安頓下來再打開電腦,已經(jīng)有少量真實截圖,以及一個簡單的評測出來了。實際上,今晚開始確實有一批媒體會首先拿到邀請碼,推出相對簡單的評測。而未來幾天,預(yù)計會有更多人拿到邀請碼,相信也會有更深度的評測出現(xiàn)。
我觀察到一個挺有意思的現(xiàn)象,有一兩個微博上的娛樂營銷號,在發(fā)布會剛結(jié)束,就發(fā)布了相信是來自「文心一言」的截圖。另一些則是濫竽充數(shù),比如我看到有個博主說是「文心一言」的截圖,實際上來自另一款產(chǎn)品「寫作貓」。
這提醒了一個之前我沒有注意到的可能,就是對 AI 聊天畫面造假。例如有一張 ChatGPT 的問答,展示了它可以正確識別「文心一言邀請碼:KFCV50」這個段子的含義。然而我實際拿去測試了 GPT-3.5、GPT-4 和必應(yīng),結(jié)果是不論是否聯(lián)網(wǎng),圖里的回答都不可復(fù)現(xiàn)。
從技術(shù)上,對網(wǎng)頁截圖造假非常容易,只要打開瀏覽器的 F12 開發(fā)者工具就可以修改相應(yīng)段落,不需要 P 圖。作為對應(yīng),「文心一言」的界面樣式在發(fā)布會上已經(jīng)公布,而其真實的界面截圖都帶有唯一的浮水印。
差評做的評測也許是第一個完整的「文心一言」評測,其中測試了發(fā)布會沒提到的編程功能,以及以表格方式呈現(xiàn)結(jié)果。這說明「文心一言」的相關(guān)「涌現(xiàn)」能力其實已經(jīng)展露,但因為算力差距擺在那里,不能預(yù)期它發(fā)揮跟 ChatGPT 一樣穩(wěn)定,出現(xiàn)不可控結(jié)果是完全有可能的。
在 ChatGPT 以及新必應(yīng)搜索剛剛引起社會關(guān)注時,很多關(guān)于它「發(fā)瘋」或出現(xiàn)滑稽結(jié)果的報道,一度讓人懷疑它的實際能力。但當(dāng)大家逐漸用上之后,有些擔(dān)心自然而然地消失了。我覺得,一個對讀者有意義的評測,或許不應(yīng)該聚焦于如何讓生成式 AI 突破禁錮或「發(fā)瘋」,而是看它可不可以完成一些實際任務(wù),可以真正作為生產(chǎn)力工具使用。
至少目前已經(jīng)可以證明:這次發(fā)布的「文心一言」并不害怕真機評測。在發(fā)布會使用預(yù)錄視頻,或許只是想讓發(fā)布會的流程更順暢一些。
整場活動大多都是演講,講的內(nèi)容或多或少之前都有線索可循。像我昨天預(yù)測的可能會用到百度自家的知識圖譜,結(jié)果今天發(fā)現(xiàn)果然如此,官方說法叫「知識增強」。而所有的發(fā)言其實都圍繞著一個目的,就是「預(yù)期管理」。
鑒于 OpenAI 的技術(shù)實力即使在硅谷范圍里也是遙遙領(lǐng)先,沒有任何理由要求「文心一言」剛發(fā)布就趕上乃至超越 ChatGPT。整場發(fā)布會的很多地方都希望大家能真實認(rèn)識到這一點,正如:「跟 ChatGPT 比了不行是意料之中的,如果有地方勝出,那就是意外收獲。」
另一個需要「管理」的預(yù)期,或許是「文心一言」的響應(yīng)速度。預(yù)錄視頻可以說明兩個問題:
所以,隨著發(fā)布會的進行,百度股價跌一點是完全在預(yù)期之中的,甚至可以說「小跌算漲」。發(fā)布會采用錄播可能進一步把當(dāng)天的股價壓了點,但「文心一言」其實并不害怕就這樣接受實測。所以稍給一點時間,股價就有漲回來的空間。
美股開盤后, ADR 走勢如下 ↓
最后,你問我能不能拿到邀請碼也做個評測?我哪知道啊。(本文首發(fā)鈦媒體APP)
責(zé)任編輯:Rex_17