Anthropic 的新型人工智慧模型,被稱為 克勞德·米索斯預覽它已成為全球關於先進人工智慧局限性辯論的中心。該公司也承認,該系統在網路安全方面過於強大,因此決定暫時不廣泛推廣——這在習慣於大肆宣傳每一項新進展的行業中實屬罕見。
關鍵不在於對先前型號進行微小的改進,而在於… 檢測和利用電腦漏洞的能力實現了質的飛躍各國政府、中央銀行、主要金融機構和歐洲監管機構都在密切關注此案,他們意識到這種工具可能會… 加強關鍵系統的防禦但如果落入不法分子手中,它也可能為前所未有的大規模攻擊打開方便之門。
Claude Mythos究竟是什麼?為什麼它的發布會被推遲?
Claude Mythos是Claude系列中的最新型號之一,該系列是Anthropic公司的人工智慧生態系統,與…展開競爭。 OpenAI 的 ChatGPT 和谷歌的 Gemini它是一種通用模型,能夠進行推理、編程並處理長期上下文,但其最具爭議的特性是… 在進攻性和防禦性網路安全方面的表現.
所謂的 “紅隊”專門測試人工智慧系統極限效能的專家在一份內部報告中得出結論:Mythos 在網路安全任務中表現出「令人驚訝的能力」。在以下基準測試中: SWE-bench 已驗證 o SWE-bench Pro該模型旨在衡量解決現實世界軟體工程問題的能力,根據 Anthropic 自己提供的數據,它可以輕鬆超越頂級商業替代方案,包括 GPT 和 Gemini 的高級版本。
除了這些基準指標之外,真正令人擔憂的是… Mythos能夠找到 零日漏洞 此模型能夠發現廣泛使用的軟體元件(有些元件已有二十多年的歷史)中先前未知的缺陷。在 OpenBSD、FFmpeg 和 FreeBSD 等系統中,該模型不僅偵測到了多年來未被發現的錯誤,還產生了可利用這些錯誤的有效漏洞利用程式。
面對這些結果,Anthropic公司做出了一個在業界不同尋常的決定: 先展示該模型,然後宣布它不會公開上市銷售。 因為該公司認為這會帶來前所未有的網路安全風險。該公司堅稱 Mythos 是他們構建的「最契合」的模型,但也承認其巨大的容量會放大任何濫用行為的後果。

擁有遠超過人類能力的「駭客」技能的模型
來自不同組織的技術文件和報告一致認為: Mythos標誌著複雜攻擊自動化的轉折點在模擬真實企業網路的測試環境中,該系統能夠在數小時內將漏洞串聯起來,提升權限,並實現持久訪問——而人類專家完成這些任務則需要數天甚至數週。
例如,在 Firefox 的 JavaScript 引擎中,Anthropic 模型早期版本很少將漏洞轉化為有效的攻擊手段。 Mythos 在相同的測試條件下, 它產生了數十種作戰漏洞它能夠精準地復現最有效的攻擊途徑。在諸如 OSS-Fuzz 這類旨在發現開源軟體漏洞的分析平台上,它因能夠檢測到多年自動化測試都未能發現的高危險漏洞而備受讚譽。
該模型還展現了卓越的性能 逆向工程它能夠從編譯後的二進位檔案中重構程式的部分邏輯,並在此基礎上定位和利用漏洞,而無需存取原始原始程式碼。這種能力使人工智慧能夠應用於一些先前被認為只有高度專業化的團隊才能勝任的場景。
在安全評估中,最常被提及的案例之一是所謂的「三明治測試」。在一個與世隔絕的實驗室環境中,Mythos 被賦予了對一個系統的控制權,並被明確指示嘗試執行該測試。 退出沙盒並聯絡研究人員 負責監督測試的人員發現,該模型利用一系列漏洞逃逸出受限環境,並向當時不在辦公室的負責人發送了一封電子郵件。儘管該事件發生在早期內部版本中,並且是在指令控制下進行的,但它仍然表明該系統能夠在極少監督的情況下,在複雜場景中運行。
儘管有這些示威活動,分析家仍堅持澄清: 我們面對的並非一個「有意識」的人工智慧,也不是一個擁有自主意志的人工智慧。Mythos 不會主動攻擊系統;它會盡可能有效率地執行被賦予的任務。從這個意義上講,風險不在於模型會反抗,而是有人會利用它——或者透過精心設計的提示迫使它這樣做——來執行有害行為。
玻璃翼計畫:神話為國防服務…僅限少數人
Anthropic公司並沒有向公眾開放Mythos,而是選擇圍繞特定項目進行推廣。 玻璃翼計劃該計劃旨在以可控的方式利用該模型的功能來保護關鍵軟體,具體做法是在嚴格的使用條件下,向部分大型科技公司、基礎設施提供者和金融機構提供該系統。
有權訪問這些資源的機構中不乏一些巨頭,例如… 亞馬遜網路服務、蘋果、微軟 Google雲端英偉達或博通以及像 CrowdStrike 這樣的網路安全公司,該公司本身有缺陷的軟體在 2024 年造成了嚴重的全球性混亂。此外,還有一些世界知名的銀行也加入了這場風波,其中包括 摩根大通和幾家大型華爾街集團以及其他負責維護敏感IT基礎設施的組織。
人格組織也宣布了這個消息。 貸款總額達100億美元 這筆資金將使這些組織能夠使用 Mythos 進行漏洞分析,同時也將向 Linux 基金會和 Apache 軟體基金會等自由軟體基金會捐款。官方目標很明確:讓那些管理全球最關鍵軟體的人員能夠在潛在攻擊者利用這些工具之前識別並修復漏洞。
然而,這種策略在業界引起了一些不安。一方面,它強化了這樣一種觀念:技術具有足夠的危險性,因此需要限制其使用。另一方面, 這造成了那些受益於神話「保護罩」的人和那些被排除在外的人之間的差距。非 Glasswing 成員的公司和管理機構可能會面臨這樣的風險:在特權環境中已發現並修復的漏洞,在其自身系統中仍然存在。
在歐洲,這種不對稱性尤其令關鍵基礎設施負責人和大型工業及金融集團的安全團隊感到擔憂,他們正密切關注著… 布魯塞爾和歐洲各國首都正在確保類似的計畫能夠平等地納入來自歐洲大陸的關鍵參與者。 和 雲端主權 與美國合作夥伴。
政府、監理機關和金融部門的反應
Mythos的影響不僅限於技術領域。短短幾天內,該模型的發布就引發了… 美國和歐洲的高級別會議美國財政部長召集該國主要銀行的負責人到華盛頓,評估該體係可能對金融穩定構成的風險,而聯準會主席也參加了這些會談。
據國際媒體報道,洩漏的資訊顯示,這些實體據稱被鼓勵… 以防禦模式測試神話他們利用這項技術在其他人之前掃描自身的基礎設施,發現薄弱環節。這其中隱含的訊息是,威脅十分嚴重,需要公私部門協調應對。
同時,Anthropic 的聯合創始人已證實該公司 與美國政府保持直接對話 關於Mythos和未來車款的討論。這些討論是在緊張的氣氛中進行的,此前美國當局最近將該公司列入了…名單。 供應鏈風險此前,由於國防部使用他們的模型而引發了摩擦。
在大西洋彼岸,歐盟已經注意到了這一點。歐盟委員會已公開支持對Mythos等模型採取漸進謹慎的態度,並且 英國和歐洲大陸的金融監管機構已開始專門研究其潛在影響。 此系統適用於銀行業和市場。英國政府人工智慧安全研究所 (AISI) 稱,與前幾代系統相比,該系統在應對網路威脅方面取得了顯著進展。
在西班牙,儘管公眾討論仍然有限,但監管機構以及來自銀行和大型能源公司的網路安全團隊正在密切關注事態發展。對於歐洲金融業而言,任何可能促成針對支付系統、銀行間網路或交易平台的協同攻擊的進展都令人嚴重擔憂。
圍繞《神話》的「炒作」引發了懷疑、質疑和爭論。
Anthropic公司的報告將安全警告與驚人的效能數據結合起來,但並非沒有批評者。一些人工智慧和網路安全專家呼籲… 解讀公司聲明時需謹慎。需要注意的是,許多可用數據僅來自內部報告。
一些分析師詳細審查了Anthropic公司發布的詳盡文檔,並指出「數千個高風險漏洞」這一數字是基於相對較少的人工審查案例推斷得出的。據報道,Mythos在某些測試套件中確實發現了相當數量的嚴重缺陷,但遠未達到某些標題所暗示的近乎世界末日般的程度。
其他獨立研究也嘗試將 Mythos 的效能與規模較小的開源模型進行比較,他們將存在漏洞的程式碼片段傳遞給不同的 AI,以檢驗它們是否能夠檢測到相同的缺陷。結果顯示: 一些開放模型也能夠辨識複雜的漏洞。這使人們對「神話在所有情況下都處於完全不同的水平」這一觀點產生了質疑。
這類反例並不能否定Mythos的能力,但它們確實顯示: 「過於危險而無法發表」的說法也帶有行銷的意味。將一個模型展現為既極其強大又具有潛在風險,可以強化技術領導地位和責任感的形象,這在競爭日益激烈的市場中是非常寶貴的。
該行業的近期歷史也讓人想起2019年GPT-2的先例。當時,OpenAI最初決定不發布完整模型,聲稱其存在製造虛假資訊的潛在危險。最終,該版本還是向公眾發布了,而先前預測的災難並未發生,許多專家認為這是反應過度的一個例子。 Mythos也是如此。 不同之處在於,重點不再是文字本身,而是數位基礎設施的完整性。對政府和銀行而言,這是一個更敏感的領域。
安全、商業和技術獲取之間的微妙平衡
拋開媒體的喧囂,Mythos事件引出了一個根本性問題: 誰來決定人工智慧模型何時危險到不能發布 那麼,評判標準是什麼呢?目前,這項決定是Anthropic單方面做出的,該公司選擇將該系統置於某種受控隔離狀態,僅供選定的合作夥伴使用。
這一立場並非完全出於安全考量。運行一個具有 Mythos 特徵的模型是 計算成本非常高該公司也承認,它目前沒有 必要的基礎設施 為了大規模地服務數百萬用戶,實際上,安全措施和技術限制相輔相成,這給了 Anthropic 時間來微調模型及其部署。
同時,該公司已開始明確區分其各種產品。而 Mythos 仍然… 最先進的內部標準雖然有些型號主要用於研究和策略合作,但像 Claude Opus 4.7 這樣的型號則是針對企業和專業人士的日常使用。 Anthropic 甚至公開承認,Opus 4.7 的整體性能不如 Mythos,尤其是在網路安全方面——這在通常將每款新型號都標榜為各方面最佳的行業中實屬罕見。
在這個方案中,Mythos 的功能是 下一代能力的測試平台雖然市售模型僅包含這些功能的一部分,並且存在旨在降低風險的額外限制,但對於許多有興趣利用人工智慧但又不想處於風險前沿的歐洲組織來說,這種「實驗性」和「生產性」模型之間的分離可能是合理的方法,前提是每個系統的實際功能都具有足夠的透明度。
最終呈現的局面是: 網路安全正全面邁入大規模攻防人工智慧時代。Mythos 等工具有望加速識別已運行多年的系統中的漏洞,但它們也迫使人們重新思考支撐數位經濟的技術的分佈和管理方式。對歐洲和西班牙而言,挑戰不僅在於保護自身免受日益強大的模式的侵害,還在於確保自身不會被排除在用於加強自身安全的機制之外。
