在最新一集的科技 podcast《Sharp Tech》中,主持人 Andrew Sharp 與資深科技分析師 Ben Thompson 再次帶來了一場火花四射的對談。這次,他們將矛頭對準了當下最炙手可熱的戰場:AI 影片生成。隨著 OpenAI 推出技驚四座的 Sora 2,以及 Meta 的 AI 應用 Vibes 上線一週後毀譽參半的市場反應,這場討論從單純的技術評測,迅速演變為一場關於用戶體驗、敘事本質,甚至主持人自我認知的深刻思辨。

Sora 2 的震撼登場:AI 影片迎來「GPT-3.5 時刻」

節目一開始,焦點便鎖定在 OpenAI 剛發布的 Sora 2。OpenAI 在其官方文章中,將這次更新稱為「影片生成的 GPT-3.5 時刻」。這不僅是一個巧妙的行銷口號,更是一個意義深遠的技術里程碑,因為正是 GPT-3.5 模型,點燃了 ChatGPT 的星星之火,並在全球掀起了生成式 AI 的滔天巨浪。

Ben Thompson 精闢地分析了這個比喻的核心。他認為,重點並非 Sora 2 會像 ChatGPT 那樣一夜之間成為現象級應用,而是其技術成熟度已經跨越了一個關鍵門檻。「初代的 Sora,就像 GPT-1 或 GPT-2,雖然新奇,但你看得出破綻。而 Sora 2,它產出的是一個『完整的想法』(a finished thought)。」Thompson 解釋道。

這意味著什麼?就像 GPT-3.5 能夠生成邏輯連貫、語意通順且具備實用價值的段落一樣,Sora 2 創造的影片擁有穩定的物理世界觀、豐富的細節和令人信服的連貫性。它不再是零碎視覺元素的拼接,而是一個真正「夠好用」、能夠承載敘事的工具。

作為節目的「普通用戶」(Normie)代表,Andrew Sharp 的反應則更加直觀。他分享道,他的 Sora feed 已經被各種腦洞大開卻又極度逼真的影片所淹沒:

  • 經典角色惡搞: 麥當勞叔叔不再和藹可親,而是開著一輛漢堡造型的改裝車,在洛杉磯高速公路上演一場警匪追逐大戲。
  • 歷史人物混搭: 馬丁·路德·金恩博士的經典演講被重新演繹:「我有一個夢想,那就是 Xbox Game Pass 的月費只要 20 美元。」
  • 跨界風格融合: 經典科幻電影《星際效應》(Interstellar)的宏大場景,被用《Minecraft》的像素方塊風格進行了完美重現。
  • 行業內部玩笑: OpenAI CEO 山姆·奧特曼(Sam Altman)化身電影主角,對著鏡頭說出那句意味深長的台詞:「我們從來都不是 OpenAI,歡迎來到 ClosedAI。」

這些案例不僅展示了 Sora 2 對複雜語意指令的驚人理解力,其「photorealistic」(相片般逼真)的視覺效果更是讓 Sharp 留下了深刻印象。這種能夠生成「看似真實」世界的能力,也與 Meta Vibes 形成了鮮明而殘酷的對比。

Meta Vibes 的冷水澡:一場關於品味與「AI 廚餘」的論戰

如果說 Sora 2 獲得的是滿堂彩,那麼 Meta Vibes 上線一週後的遭遇,則像是一場突如其來的暴風雪。這也成為本集節目最精彩的轉折。就在上一集緊急加更的 podcast 中,Ben Thompson 還對 Vibes 抱持著極大的熱情,認為其超現實的視覺風格代表了一種新的創意方向。然而,一週過去,聽眾的負面反饋如雪片般湧入,毫不留情。

節目中引述了幾位聽眾的尖銳評論,直指問題核心:

  • 聽眾 Lulian 指出,人們之所以對 Instagram Reels 上癮,是因為內容「有趣或性感」,但 AI 生成的「廚餘」(AI slop)——這個詞精準地描述了那些缺乏靈魂、為產出而產出的內容——兩者皆非。它缺乏能引起共鳴的「內在衝擊力」(visceral)。
  • 聽眾 Carlin 的感受更為強烈:「我打開 Vibes,立刻感受到一種發自內心的負面反應。」他認為這些影片空有視覺奇觀,卻沒有任何敘事弧線,僅僅是「可愛、超現實或引人注目的視覺效果搭配活潑的音樂」。他甚至毫不客氣地建議 Ben:「去摸摸一些威斯康辛的草吧!(Go touch some Wisconsin grass!)」意指 Ben 已經脫離了正常人的感知。
  • 另一位聽眾 Alexander 則表示,他只用了 30 秒就關掉了應用,並直言:「比起看 AI 生成的虛假灌籃,我寧願去看真正的 NBA 球員表演。」

面對排山倒海的批評,Ben Thompson 進行了一場坦誠得令人敬佩的自我剖析。他承認,自己可能真的是個「怪咖」(weirdo)。他的媒體消費習慣與主流大相徑庭,他會著迷於那些「無敘事」的內容,比如 Apple TV 的空拍螢幕保護程式,或是科幻小說中龐大的世界觀設定。對他而言,Vibes 那些支離破碎的超現實畫面是「激發靈感的」(inspirational),因為他的大腦會自動為這些視覺碎片填補敘事和意義。

然而,他也意識到這恰恰是他的盲點所在。「大多數用戶需要的,是被給予一個完整的故事,而不是一個需要自己動腦去詮釋的畫面。」Andrew Sharp 的反應也印證了這一點,他坦言當 Ben 第一次在 Zoom 上向他展示 Vibes 時,他很快就感到無聊了。這場意外的論戰,揭示了所有 AI 內容生成工具面臨的終極挑戰:技術上的驚奇感,能否轉化為可持續的用戶黏性?對大多數人來說,答案顯然是否定的。

戰略對決:OpenAI 的產品思維 vs. Meta 的注意力危機

這場 AI 影片的正面交鋒,也凸顯了兩家科技巨頭在產品策略上的巨大差異。Ben Thompson 斷言,Meta 可能正陷入一場「大麻煩」(big trouble),原因有三:

注意力是終極貨幣

Meta 的整個商業帝國都建立在用戶的注意力之上。TikTok 早已蠶食了其大量的用戶時長,而現在,OpenAI 憑藉 ChatGPT、DALL-E 乃至 Sora 2,正一次又一次地引爆全球輿論,成為注意力的黑洞。

無法複製的產品力

Meta 過去的成功策略之一,是將競爭對手的功能(如 Snapchat 的 Stories)迅速複製並整合到 Instagram 中。但這次不同,Sora 2 的體驗在質地上遠超 Vibes。Meta 無法再靠簡單的模仿和流量灌溉來贏得這場戰爭。

純淨 AI Feed 的認知優勢

Thompson 提出了一個有趣的觀點:一個「純 AI 內容」的 feed(如 Sora 2 的展示),在認知上可能比一個混合了真實與 AI 內容的 feed(如 Instagram)更具優勢。因為在前者中,用戶無需花費心力去分辨真假,可以完全沉浸在「這一切都是假的」設定中,從而專注於創意本身。

OpenAI 再次證明,他們不僅是頂尖的 AI 研究機構,更是卓越的產品公司。他們擅長將極度複雜的底層技術,打包成簡單、易用且具有病毒傳播潛力的產品,Sora 2 很可能成為下一個典範。

創作者經濟的質變與「廚餘革命」的隱憂

在節目的尾聲,討論轉向了這些工具對未來的深遠影響。Ben Thompson 重提了網路社群中著名的「90-9-1 法則」:90% 的用戶是沉默的觀察者(潛水者),9% 的用戶會參與互動(點讚、評論),只有 1% 的用戶會創造原創內容。

他大膽預測,像 Sora 2 這樣極大降低創作門檻的工具,將徹底打破這個法則。「當任何人都能用一句話生成一部電影短片時,那 1% 的創作者比例可能會擴大到 2%、5%,甚至更高。」這意味著我們即將迎來內容數量的指數級增長,這將是一場波及所有人的巨大變革。

然而,這場潛在的「廚餘革命」也帶來了無數懸而未決的問題。當以假亂真的影片可以被輕易製造時,我們該如何應對虛假資訊的泛濫?當我們的螢幕被無盡的、缺乏真實情感和敘事的 AI 內容填滿時,這會對我們的社會心理造成怎樣的影響?正如聽眾 Carlin 所擔憂的,這是否只是引領我們走向一個更加原子化、更加孤立的數位社會的又一步?

Sora 2 和 Vibes 的這場對決,或許僅僅是 AI 影片時代的序幕。最終的勝利者,將不僅取決於誰的演算法更先進,更取決於誰能更深刻地理解——並滿足——人類對故事、情感和真實連結的永恆渴望。


參考資料與延伸閱讀

原始連結:https://sharptech.fm/member/episode/preview-sora-2-and-an-ai-video-boom-metas-vibes-one-week-later-questions-on-tik-tok-solar-power-and-the-i-phone-air