Anthropic 最新被討論的神祕模型 Mythos,如果只把它理解成「又一個更會寫程式的 Claude 版本」,那大概只看到了表層。從節目裡釋出的訊息以及近日發布的 System Card 來看,Mythos 的重點不是聊天體驗,也不是一般人熟悉的寫程式助手,而是把大型語言模型推進一個更敏感的區域:
自動找漏洞、理解攻擊面、提出修補方案,甚至可能重寫整個資安工作的成本曲線。真正值得注意的不是它危不危險,而是它一旦有效,整個軟體產業、雲端產業與國家安全體系都得重估邊界。
這也是為什麼這則消息聽起來像科幻,實際上卻非常符合產業演進邏輯。Anthropic 並不是突然從天上掉下一台「數位末日機器」,而是沿著現有模型能力、企業市場需求與安全治理框架,把 LLM 最擅長的一件事推到極致:把程式碼當成可被大規模閱讀、比對、歸納與重寫的語料。問題在於,當模型開始大量發現人類過去數十年累積的漏洞,這種能力本身就不再只是生產力工具,而會變成一種戰略資產。
真正危險的從來不只是 AI 變強,而是它第一次讓「找漏洞」這件事可以規模化、標準化,而且高度商品化。
為什麼「會寫程式的模型」天然會走向資安
很多人把 AI 寫程式和 AI 做資安看成兩條不同賽道,其實它們幾乎是同一棵樹長出的兩條枝幹。原因很簡單:程式碼是高結構化文字,漏洞則是程式碼、系統行為與邊界條件之間的不一致。只要模型能理解函式呼叫、記憶體生命週期、輸入驗證、權限邏輯與依賴關係,它就不只是能幫你補完程式,還能開始懷疑這段程式哪裡會出事。
這點已經不是紙上談兵。Anthropic 在 2026 年初公開與 Mozilla 的合作時提到,Claude Opus 4.6 在兩週內發現了 Firefox 的 22 個漏洞,其中 14 個被 Mozilla 評為高嚴重性。而更令人震驚的是,根據最新的資訊,Mythos Preview 在短短幾週內,於所有主流作業系統和瀏覽器中發現了數千個零日漏洞(Zero-day vulnerabilities)。在 Firefox 的基準測試中,Mythos 成功開發出了 181 次可運作的漏洞利用程式(exploit),相較之下,Opus 4.6 僅有 2 次。這直觀地說明了兩代模型之間的能力鴻溝:
AI 不再只是幫工程師加速,而是在某些資安任務上,開始具備超越頂尖獨立研究員的產出密度與深度。在 SWE-bench 基準測試上,Mythos 的解題率高達 93.9%,遠超 Opus 4.6 的 80.8%,在 OSWorld 等代理任務上也都有顯著提升。
Google DeepMind 在之前的資安威脅評估也印證了同一個方向。他們分析了超過 12,000 起真實 AI 濫用嘗試,歸納出典型攻擊場景並建立基準測試。這套框架的重點不是宣稱「AI 已經能毀滅網路世界」,而是指出:一旦模型能讓偵察、漏洞利用、持久化與規避偵測變得更快、更便宜、更自動化,防守方的成本結構就會整個改寫。
所以 Mythos 真的是「太危險不能公開」嗎?
這裡就到了最有趣、也最值得懷疑的部分。每當 AI 公司說某個模型「過於危險」,聽眾很自然會想到兩件事:第一,這是不是有真實風險;第二,這是不是也是一種行銷。答案往往不是二選一,而是兩者同時成立。
從真實風險來看,Anthropic 自己的 Responsible Scaling Policy 一直強調,前沿模型一旦跨過某些能力門檻,就需要升級安全與部署措施。Anthropic 官方表示,Mythos 的漏洞挖掘能力過於強大,若落入惡意行為者手中,將對全球網路安全構成嚴重威脅。這與前沿模型安全、模型權重保護、存取控制與濫用監測的思路其實完全一致。換句話說,Anthropic 並不是突然演戲,他們本來就一直在鋪一套敘事:
某些模型不該被視為普通 SaaS,而該被視為需要特別保護的基礎設施。
但從商業面看,這種「危險性敘事」同樣有極高價值。因為一旦市場接受這個前提,Anthropic 就不只是賣模型 API,而是在賣受控存取、可信安全流程、企業級責任分層與準國防級合作能力。你買的不是一個更聰明的聊天機器人,而是一個有資格接觸關鍵基礎設施程式碼的供應商。這種定位的毛利、定價權與客戶黏性,遠高於一般消費型 AI。
真正的商業機密,不是模型多可怕,而是誰能用:解讀 Project Glasswing
Anthropic 宣布不全面公開 Mythos,取而代之的是推出名為 Project Glasswing 的防禦性資安計畫。這個計畫聯合了 Apple、Microsoft、Google、AWS 等 12 家科技巨頭,讓這些精選的合作夥伴能夠運用 Claude Mythos Preview 模型進行防禦性資安研究,找出並修補自身系統的漏洞。這才是 Mythos 真正的去處。
這背後最核心的機密其實不是權重本身,而是
分配機制。因為分配機制決定誰先擁有「大規模掃描、驗證、修補」的能力,誰先把別人還沒發現的風險變成自己的競爭優勢。
這和一般人想像的開源或 API 普惠完全不同。AI 產業前兩年最重要的敘事是普及:讓更多人能寫程式、做圖片、跑 agent。可當模型碰到資安與國家安全邊界,敘事就會翻面,變成審查、分級、限流與選擇性供應。這不是退步,而是商業模式成熟後的必然。軟體世界最貴的產品,往往不是最多人能用的,而是最少人被允許使用的。
而且別忘了算力現實。前沿模型本來就不是廉價資源。若 Mythos 需要更長時間上下文、更重的工具調用與更高頻的驗證流程,那麼它最合理的去處本來就不是一般消費市場,而是少數願意付高單價、也能承擔治理要求的企業客戶。說穿了,
「安全原因不公開」和「高價值客戶專屬」常常是同一件事的兩種說法。Project Glasswing 就是這個商業邏輯的最佳體現。
資安產業會怎麼被改寫?先從「找 bug」變成「清庫存」開始
如果你把整個軟體世界想成一座城市,那過去幾十年寫下來的 legacy code 就像沒有完整圖資、補丁紀錄混亂、還混著不同年代建材的老舊街區。傳統資安研究員能做的是抽樣巡查、接到通報再封路,或者靠經驗猜哪裡最危險。Mythos 這類模型的意義,在於它可能第一次讓產業有工具去做「系統性清庫存」:把多年累積、沒人有空重新審計的程式碼,重新掃一遍。
這也是為什麼 DARPA 近年的 AI Cyber Challenge 特別值得拿來對照。這項競賽明講目標就是打造能自動識別並修補原始碼漏洞的 AI 系統,針對的是醫院、電網、供水系統等關鍵基礎設施使用的開源軟體。當軍方研究機構、開源安全社群與前沿模型公司都在往同一方向押注時,市場訊號其實已經很清楚:
自動化漏洞發現不是邊角料,而是下一代資安基礎能力。
對大型軟體公司來說,這會先帶來兩種改變。第一是修補速度大幅上升。原本需要資深研究員花數週到數月才找出的缺陷,可能被壓縮到數小時或數天。第二是治理壓力暴增。因為一旦市場知道你理論上可以用 AI 更快發現問題,監管機構、企業客戶與保險公司就會反過來問:既然能找,為什麼你沒找?既然能補,為什麼你還沒補?
看多、看空與中立:Mythos 可能帶來的三種敘事
先看最樂觀的版本。看多派會認為,Mythos 代表資安產業第一次有機會從「永遠追著事故跑」變成「主動消化技術債」。這不只對軟體公司有利,對整個網路世界都是好事。瀏覽器、核心套件、加密函式庫、基礎設施元件被更快修補,理論上能降低大規模勒索、供應鏈攻擊與零時差漏洞擴散的機率。從這個角度看,Mythos 更像是防禦端的印鈔機:它把過去高度稀缺、極難規模化的資安研究工作,變成可以被複製的生產流程。
看空派則會說,這種能力不可能永遠只停留在防守方。只要模型本身能在封閉環境裡持續推理、生成 exploit、測試變種並修補失敗路徑,那麼攻擊方遲早會以某種形式獲得類似能力。未必要偷到 Anthropic 權重;只要同業模型持續進步,或者黑市出現專門為漏洞利用調校的代理系統,防禦優勢就會迅速被套利。Mythos 雖然被限制存取,但它已經向世界證明了「這條路走得通」。從這個角度看,Mythos 不是護城河,而是軍備競賽的起跑槍。
中立派的看法則比較務實:短期內,最受惠的其實不是終端使用者,而是有能力整合模型、測試基礎設施、資安團隊與修補流程的大企業(如 Project Glasswing 的成員)。也就是說,Mythos 不一定先改變世界,但很可能先擴大巨頭與中小型軟體團隊之間的安全差距。大公司會更早把漏洞發現自動化,小團隊則可能連把 AI 安全掃描接進 CI/CD 都很吃力。於是,資安能力分布會更像雲端運算:強者更強,弱者更依賴平台。
競爭對手會怎麼走?OpenAI、Google、雲端巨頭都不會袖手旁觀
就算 Mythos 目前只向特定合作夥伴開放,它也已經把題目出給所有競爭者了。OpenAI 會不會把 coding agent 往漏洞研究方向延伸?Google 會不會把 DeepMind 的攻擊鏈評估框架,進一步變成企業安全產品?微軟、AWS、Google Cloud 會不會把模型掃描能力直接綁進雲端安全套件?答案幾乎肯定是會。
原因在於,這類能力和既有產品線天然相容。雲端平台本來就在賣日誌分析、端點保護、威脅偵測、身分控管與 DevSecOps;如果再多一層能閱讀整個 codebase、主動提出 exploit 與 patch 建議的模型,產品價值會大幅上升。更重要的是,客戶資料本來就已經在雲端裡,整合成本遠低於新創單點工具。Anthropic 若想把 Mythos 變成長期業務,而不是一波聲量,它最終得面對的不是媒體質疑,而是平台分發權。
為什麼這件事會碰到國家安全邊界
Anthropic 在談前沿模型安全時,曾直接主張先進模型與模型權重應被視為需要高度防護的戰略資產,甚至把前沿 AI 產業比擬成某種「關鍵基礎設施」。這種說法以前聽起來像政策白白皮書口吻,現在因為 Mythos 這類故事而突然變得具體。因為當一個模型能系統化發現瀏覽器、作業系統、開源套件或工業控制堆疊的漏洞,它影響的就不再只是某家公司某個產品,而是公共網路與國家基礎設施的表面積。近期甚至傳出美國政府針對 Anthropic 的相關產品實施禁令或限制的討論,凸顯了事態的敏感性。
這裡最麻煩的,不是美國政府會不會想用,而是政府會不會認為這種能力不能只由私人公司定義存取規則。你可以想像未來出現幾種政策路徑:更嚴格的模型權重保護要求、特定國家與企業的出口管制、針對前沿模型安全的採購門檻、甚至某些模型能力只能在合規環境內由指定客戶使用。這未必是正式國有化,但很可能是
實質上的準國家化治理。
延伸思考:真正的「狼」不是模型,而是舊世界的程式碼
Ben Thompson 把這個題目拉回《放羊的孩子》,很有意思。因為 AI 公司這幾年確實常常誇大風險,有時是為了監管護城河,有時是為了市場注意力,久了外界自然會麻木。但這並不代表風險不存在,只代表敘事常常先於現實。
如果把 Mythos 從八卦感拿掉,剩下的核心命題其實很樸素:
人類建立的數位世界,程式碼庫實在太大、太舊、太複雜,早就超出純人力審計的合理範圍。所以,只要有工具能顯著提升漏洞發現效率,它終究會被部署。真正的問題不是要不要讓 AI 參與資安,而是我們能否在它全面參與之前,把責任分工、漏洞揭露流程、修補節奏與濫用防線先設計好。
也因此,我會把 Mythos 看成一個產業分水嶺訊號,而不是單一產品新聞。它預告的是:未來幾年最值錢的 AI,不一定是最會聊天、最會畫圖、最有情緒價值的模型,而可能是那些能默默替大型系統找出致命 bug、又只對少數人開門的模型。這樣的 AI 當然危險;但更準確地說,它危險的地方在於它同時是防禦工具、商業武器與地緣政治資產。這才是 Mythos 真正的商業機密。
延伸閱讀
- Anthropic 官方宣布 Project Glasswing:Project Glasswing
- Claude Mythos Preview System Card:Claude Mythos Preview System Card
- Google DeepMind 對 AI 網攻風險的實證評估:Evaluating potential cybersecurity threats of advanced AI
- DARPA AI Cyber Challenge 的公開說明:DARPA to announce AI Cyber Challenge winners, bring new experience to DEF CON 33
- 原始討論來源:Sharp Tech:Mythos and Project Glasswing