十年前,移動互聯網充滿朝氣,每天都有新芽從智能手機的沃土中長出。
十年后,我們早已習慣了 Web 2.0 社會,相關技術也基本發展至中后期,我們中的極少數,正在尋找 Web 3.0 的曙光。
Open-AI/MetaVerse/NFT/Stable Diffusion/DeFi 云云,一眾新詞扎堆涌現,仿佛十年前的蓬勃光景再度重現。
(資料圖片)
新的工具正摩拳擦掌,蓄勢待發,沒有人甘于落后。歡迎大家來到第七期 Hunt Good 周報,跨入數字工具次世代。
Happy Hunting!
Hunt Good 導讀
Bento,將任務塞進「便當」
Readwise Reader,收集一切
Luma AI,iPhone 攝像頭不光能拍照和掃碼了
VALL-E,機器學舌
NeevaAI,ChatGPT 挑戰者
Bento,將任務塞進「便當」
又雙叒叕是一款 To-Do List 工具,這類型的軟件大家早已見慣不怪了,為什么還有新人踏足這一品類,如果不能整出點新活,那一定會被時間沖刷掉,消失在我們視線之外。
Bento,這是「便當」的英文,這款 app 提議我們將日常工作先歸類,再執行,而不是一上來就開干,在這套產品邏輯背后,其實開發者是想用這款 app,培養我們凡事「三思后行」的思維。
盲目開干不可取,先歸類,每天事務如此地多,先分個輕重緩急,才不會像無頭蒼蠅那樣到處碰壁。
它名字叫便當,交互上也像極了我們在給便當盒填充食物時的操作。
一般來說,便當盒有隔區,這放肉食,那放米飯,Bento 也是如此,他們借用了「便當理論」,在填寫待辦事項之前,就要求用戶先把任務拆分成「小/中/大」三種類型,他們對這三種類型任務也有自己的定義。
小任務:容易解決,能幫你積累起工作自信;
中型任務:需要一定時間精力去處理,但難度不大;
重度任務:包括會議在內的,需要十分集中精神去處理的事項。
這一套歸類思維,便是 Bento 的靈魂,值得我們學習借用,畢竟對于這么一款收費軟件而言,不是所有人都愿意掏錢嘗試,但每天當你往其他 To-Do 清單填寫待辦事項時,先想想執行次序,便也能達到 Bento 所能實現的效果。
Readwise Reader,收集一切
Readwise 是一款書摘軟件,從它脫胎而來的 Readwies Reader,則是一款閱讀器。
用它可以看 RSS、PDF、YouTube 視頻,你可能會說,這不都是常規操作嗎?但它把這些功能都做得更進一步。
可以在 RSS 網頁標注并留下評論,信息采集愛好者必備功能;可以閱讀 PDF 內容,同樣可以進行批注;看 YouTube 內容時,可以將視頻內容壓縮成文字(自動輸出逐字稿),然后劃線收集加批注,大幅壓縮視頻內容的信息密度。不過該功能目前僅支持英文視頻。
如果你將 Twitter 賬號進行關聯,就能保存 Twitter 的信息流內容,方便進行信息采集,電子郵件、電子書亦然(支持 Epub 格式)。
它的作用在于,盡可能將內容都采集到一個地方,方便查閱的同時,自己也可以從中找到毛線頭,進行自己的思考作業。
同時它鼓勵用戶使用快捷鍵進行操作,一定程度上提升了桌面端采集信息的效率。
Luma AI,iPhone 攝像頭不光能拍照和掃碼了
蘋果從 2017 年的 WWDC 起,便推出了 ARKit 增強現實開發套件,以供開發者針對 AR 場景開發應用,此舉也被視為給未來的元宇宙硬件產品鋪路。
而 2020 年,蘋果在 iPad Pro 和 iPhone 12 Pro 上加入的 LiDAR 激光雷達鏡頭,則讓移動設備也有了采集物體 3D 空間信息的能力。
經過兩年的發展,手機也擁有可觀的建模能力,于是 Luma AI 應運而生。
不得不說,Luma AI 的建模能力,初見細節已經非常細膩,配合現實世界的光影反射效果,網友驚呼:現在游戲的畫質都那么高了嗎?
在 Twitter 上,有網友利用 Luma AI 給摩托車手建模,放在游戲畫面中,剪成偽賽車游戲視頻,足夠以假亂真。
還有作者將 Luma AI 的掃描圖成像畫面剪成 MV,頗有一番風味。
有意思的是,Luma AI 的創始人正是從蘋果的增強現實及計算視覺部門出來的,知己知彼,因此 Luma AI 在 iPhone 上的效果也十分理想,乍看之下,它所完成的掃描精度,可以算得上是「照片級」了。
不過放大之后,還是會露餡,尤其是掃描毛絨玩具這類材質表面凹凸不平的物體,放大后會發現起表面變得模糊不清,一束束毛發變成了一坨不可名狀物。
不過隨著手機算力提升,得到更高清的模型只是時間問題罷了,在 Luma AI 的引領下,我覺得這個要求并不算難。
VALL-E,機器學舌
微軟早前投資了 OpenAI,近期更是傳出將跟投 100 億美元,后續必然還會加大投入,因為微軟已經打算將 OpenAI 所研發的人工智能技術融入到旗下產品的方方面面。
而微軟在 AI 領域的最新成果是一項剛剛發表的論文,其中宣布了人工智能語音系統 VALL-E,它的最大特性是「鸚鵡學舌」。
VALL-E 可以對一段人類錄音進行學習,錄音時長只需超過三秒,它就能模擬出這個人的聲線,輸出其他語音內容,就連口音都能復刻。
目前這項技術尚未生成產品,只在 Github 上闡述了模型概要以及一些語音示例。
VALL-E 尚未完善,在一些示例中,它的模仿力很是強悍,與原聲近乎相同;但在另一些示例中,人類原聲帶有明顯的口音,而它生成的語音卻字正腔圓,發音十分標準,容易露餡。
VALL-E 越接近真人,我心里越是擔心,如果它落在壞人手上,是否會成為詐騙利益鏈條中的一環呢?
如果人類未來分辨不出電話那頭的是真人或是 AI,那我們是否能夠借助技術,幫我們進行甄別呢?
對此,VALL-E 也給出了自己的解決方案:增加了道德聲明,后續用協議去規范使用用途,雖說聊勝于無,但有了一定約束,也能讓一些「有賊心沒賊膽」的人,回頭是岸。
此外,微軟除 VALL-E,還將把 ChatGPT 引入到 Bing 瀏覽器,將 OpenAI 的一些技術與 Office 套件融合,可見 2023 年「AI + Everything」的趨勢,將愈演愈烈。
NeevaAI,ChatGPT 挑戰者
都說 ChatGPT 是下一代搜索引擎的雛形,而如今一個搜索引擎做出了另一個「ChatGPT」,那就是 Neeva。
兩年前 Neeva 被評選為 2021 年度百大最佳發明之一,就因為它沒有廣告,一班從 Google 出來的年輕人,建立了這個沒有廣告的搜索引擎,采用訂閱制模式,一直活得好好的。
▲
清爽的搜索界面
他們號稱搜索結果更純凈,也更準確。如今他們將這一優勢延續到問答平臺上,推出了 NeevaAI。用法跟 ChatGPT 類似,界面只有一個文本框,用戶把問題輸入進框,數秒后它就能生成一個答案。
與 ChatGPT 不同的是,NeevaAI 會把回答里出現的內容來源統統標注出來,有據可依,可追溯來源,它生成的答案更有說服力。
NeevaAI 號稱每日抓取數以億計的網頁內容,實時更新,這點比 ChatGPT 要先進一點。也正是這一點,NeevaAI 應用場景也更廣。
當然了 ChatGPT 一旦開放聯網功能,兩者孰高孰低,就不好說了。
點擊「在看」
是對我們最大的鼓勵
責任編輯:Rex_15