谷歌推出Gemma 4,這是其在開放和本地人工智慧領域的一項重大投資。

  • Gemma 4 是基於 Gemini 3 技術的四個開放式 AI 模型系列,參數規模從 E2B 到 31B 不等。
  • 這些模型結合了高度“參數智能”,並可在移動、邊緣和專有基礎設施上進行本地執行,這得益於高達 256K 個代幣的上下文視窗。
  • Apache 2.0 許可證允許不受限制的商業用途,加強了數位主權,並促進了在歐洲受監管環境中的部署。
  • Gemma 4 是多模態的(小模型包含文字、圖像、視訊和音訊),支援 140 多種語言,可在 Google AI Studio、Hugging Face、Kaggle 和 Ollama 中使用。

Gemma 4 AI 模型

谷歌在其策略中邁出了重要一步 開放式人工智慧 隨著 Gemma 4 的發布,全新系列的人工智慧模型旨在將高水準的推理能力與更低的硬體要求相結合。該公司將這一代產品定位為需要在自有基礎設施(從行動裝置到資料中心)上運行高級人工智慧的用戶的理想選擇。

它遠非單一模式, Gemma 4 是一套完整的四款開放式變體產品系列。該提案旨在為希望更好地控制其資料和部署的開發者、企業和公共實體而設計,尤其符合以下需求: 歐洲的數位主權與監理合規決定執行地點和資料儲存地點的權力變得越來越重要。

一個包含四個模型的家族,專注於「基於參數的智慧」。

Gemma 4 型系列

Gemma 4 的技術基礎與 Gemma 4 相同。 雙子座3但其目標很明確:最大限度地利用谷歌所說的 “基於參數的智能”該公司並沒有僅僅依靠尺寸來競爭,而是自豪地宣稱,其相對緊湊的型號已經達到了與更大系統相當的性能水平。

該家庭由 四種不同尺寸:有效2B(E2B)、有效4B(E4B)模型 26B 採用混合專家(MoE)架構 以及一種密集的變體 31B 參數後者已位於 在 Arena AI 的開放模型排名中位列前三它超越了參數數量增加二十倍的替代方案,這對於那些希望在不犧牲品質的前提下降低 GPU 成本的人來說尤其重要。

的模型 26B 教育部 它經過優化,在推理過程中僅激活其部分參數(約 3,8 億),從而提高了令牌生成速度和能源效率。相比之下,版本 31B 密集型 它被定位為在商業或機構環境中進行精細調整任務、複雜編排和密集使用的首選方案。

谷歌強調,就公開基準測試而言,這些變體直接與來自其他供應商的更強大的型號競爭,包括來自中國製造商(如 DeepSeek 或 Qwen)的型號,這些製造商近年來在開源生態系統中變得強大。 Gemma 4 的 31B 被 Arena AI 列為第三好的開放式模型同時,26B MoE 也排名很高。

從商業角度來看,規模與績效之間的這種關係意味著 更低的硬體支出,更低的延遲 以及在單一系統中運行邊界模型的能力 NVIDIA H100 80GB GPU這為歐洲中型企業無需投入巨額基礎設施即可使用先進的人工智慧技術打開了大門。

口袋大小的人工智慧:行動、物聯網和邊緣運算

行動裝置上的 Gemma 4

較小的型號 E2B和E4B它們被專門設計用於在網路邊緣運行,也就是說,在 行動裝置、物聯網和本地硬體谷歌指出,這些變體經過優化,可在以下平台上運行: 安卓智慧型手機 樹莓派Jetson Nano 以及其他低功耗系統,延遲非常低,甚至無需網路連線。

在這個領域,首要考慮的不僅是原始動力,還有提供動力的能力。 多模態功能和快速響應 在資源受限的環境中,Gemma 4 邊緣模型可以處理 文字、圖片和視頻而對於 E2B 和 E4B,它們則增加了原生支援。 音頻如此一來,無需將資料傳送到雲端,即可實現本地語音助理、現場影像辨識或即時視訊分析等應用場景。

這些輕量級模型的上下文視窗達到 128.000令牌這足以在一次提示中處理長篇文件、大量對話或相關程式碼片段。谷歌表示,這種結合了廣泛上下文和本地執行的方式有助於消除摩擦。 隱私、連線和延遲這對於歐洲的工業、醫療保健或教育計畫來說非常重要,因為這些地區對資料處理的限制越來越嚴格。

從硬體製造商的角度來看,Gemma 4 為整合打開了大門。 先進人工智慧直接應用於消費性產品從智慧型手機和平板電腦到醫療設備和工業感測器,該公司強調,這些型號的設計旨在與高通和聯發科等常見的安卓生態系統供應商的晶片配合使用,從而促進其廣泛應用。

此外,邊緣模型的架構利用了以下技術: 逐層嵌入(PLE) 為了最大限度地提高參數使用效率,使得推理和理解上下文所需的計算成本比通用模型通常的計算成本要低得多。

多模態、代理和高級開發人員支持

Gemma的4種多模式能力

Gemma 4 的優點之一是其對下列事項的明確承諾: 代理商工作流程這些模型不僅限於生成文字:它們本身就整合了多種功能。 函數呼叫、結構化 JSON 輸出和系統指令這樣就可以建立自主代理,協調各種步驟,呼叫外部 API,並以易於與企業應用程式整合的格式傳回結果。

谷歌堅稱,Gemma 4 系列的所有車型都經過精心設計。 高級推理者它具備可配置的思考模式,可以根據任務調整推理深度。這轉化為更好的結果。 多階段推理,離線程式碼生成 以及複雜的解決問題的能力,這是企業和公共管理環境中需要可靠性的關鍵方面。

在多模態平面上,這四個模型可以處理 不同解析度和寬高比的文字和圖像而 E2B 和 E4B 型號則將此容量擴展至 視頻和音頻例如,這種組合可以實現這樣的系統:分析具有圖形的文件、工業監控視訊或豐富的教育內容,並即時產生上下文響應。

上下文視窗到達 最大模型中發行了 256.000 個代幣這使得用戶能夠在一次查詢中上傳整個程式碼庫、冗長的法律合約或大量技術文件。對於支援、諮詢或 IT 審計團隊而言,這可以更輕鬆地實現以往需要耗費數小時人工審核的任務自動化。

在語言方面,Gemma 4 原生支援超過 140種語言對於歐洲,特別是對於西班牙而言,這意味著可以開發涵蓋從歐盟主要語言到使用較少的語言的多語言解決方案,從而幫助實現公共和私人服務的可及性和包容性目標。

歐洲的雲端整合、數位主權與部署

Gemma 4 的部署並不限於本地硬體。谷歌已將這些模型整合到其雲端產品中。 頂點人工智能 y 谷歌 Kubernetes 引擎 (GKE)允許組織配置專用運算資源並按需擴展推理工作負載。對於受監管的歐洲行業,這也與其他選項相結合,例如: 主權雲 以及實體隔離或本地部署,並根據資料駐留要求和遵守一般資料保護規範 (GDPR) 進行調整。

該公司強調,較大型號的bfloat16精密配重可以高效運作。 單塊 80GB NVIDIA H100 GPU降低希望維持對基礎設施控制權的中型企業或公共機構的進入門檻。在量化版本中,這些模型也可以在以下情況下運行: 消費級硬體或工作站擴大可能的部署範圍。

對於西班牙和歐洲其他地區的技術經理來說,這種組合 開放模式、受控部署和主權雲端支持 它允許設計混合架構:部分智慧可以駐留在本地資料中心,而其他不太敏感的工作負載可以在公有雲中運行,同時保持共同的技術基礎。

此外,谷歌還提供 代理開發套件(ADK)一個模組化框架,簡化了基於 Gemma 4 的代理程式的創建、測試和部署。它也依賴以下服務: Cloud Run 與 NVIDIA RTX PRO 6000 GPU(Blackwell) 採用無伺服器模式,可以啟動高強度試點項目,而無需從一開始就購買自己的硬體。

在歐洲,關於人工智慧的辯論通常圍繞著控制、透明度和可審計性展開,而人工智慧的可能性… 在受控基礎架構中,根據 Apache 2.0 部署開放式模型 它對需要將創新與嚴格的監管框架相協調的政府機構、銀行、保險公司或醫療保健行業的公司尤其具有吸引力。

Apache License 2.0、開放的生態系統和社區支持

如果有什麼方面特別引起了社區的關注,那就是決定以某種形式授權 Gemma 4。 阿帕奇2.0先前的 Gemma 版本使用自訂許可證,這給商業產品帶來了法律問題;現在,採用標準的開源許可證, 開發者和公司可以更輕鬆地修改、重新分發模型並實現其商業化。.

谷歌此次發布正值其努力之際。 在開放模型生態系中重新站穩腳步先前,Meta 的 Llama 等替代方案以及中國本土模型(DeepSeek、Qwen、GLM、Minimax)的普及率都已提升。業內頗具影響力的人物,例如 Hugging Face 的聯合創始人,將此舉描述為本土人工智能發展的一個“巨大里程碑”,並強調法律團隊現在擁有一個更加清晰的框架來審批基於 Gemma 4 的項目。

在Gemma系列推出新版本之前,圍繞該系列的生態系統就已經展現出強大的實力。谷歌指出,前幾代產品的表現都超過了… 400次下載 而且該社區已經創造了超過 100.000種 適用於不同語言和使用場景。其中最引人注目的例子是專門針對以下場景的模型: 保加利亞語 或癌症研究工具,例如 Cell2句子尺度 由耶魯大學開發。

公司希望透過《Gemma 4》進一步擴展「Gemmaverse」宇宙,吸引更多玩家… 歐洲新創公司、大學和研究中心 創建他們自己的衍生版本。寬鬆的授權協議和開放的權重相結合,使得開發專注於特定領域的版本成為可能,例如醫療保健、司法、工業4.0或教育,這些版本隨後可以不受太多限制地共享或銷售。

對於西班牙公司而言,這意味著他們可以在 Gemma 4 上建立專有解決方案——例如內部助手、企業搜尋引擎或高級分析系統——同時保持對程式碼、資料和基礎設施的控制,這非常符合加強自主權的趨勢。 歐洲技術主權.

應用案例:從新創公司到大型企業

Gemma 4 已向公眾展示了各種各樣的 潛在的應用在商業領域,模型可以用來創建 多語虛擬助手 能夠透過高階推理處理複雜查詢,或在開發團隊中自動產生和審查程式碼。

較大的模型則適用於以下任務: 協調代理人,分析大量文檔這包括產生技術報告或協助法律和合規部門。寬泛的上下文視窗和多模態支援相結合,使得單一客服人員能夠輕鬆地在同一工作流程中處理合約、電子郵件、圖表、監控系統影像和錄音。

在教育和公共部門,處理文字、圖像以及在某些情況下處理視訊和音訊的能力,使得創建以下內容成為可能: 學習支援平台 它可以產生摘要、逐步解釋或適合不同程度的材料。在地化實施也有助於在處理未成年人或弱勢群體的敏感資料時尊重隱私要求。

在創業領域,Gemma 4 可以成為基礎。 垂直產品 在金融科技、數位醫療、物流或 B2B SaaS 領域,由於 Apache 2.0 提供的彈性,團隊可以做到 微調 在他們自己的數據上建立模型,將其部署在本地或雲端,並將結果推向市場,而無需受到嚴格的專有許可的限制。

對歐洲而言,尤其值得關注的是發展的可能性。 本地人工智慧解決方案 例如,透過將資料儲存在位於歐洲境內的資料中心,並將模型置於組織的直接控制之下,來遵守國家和社區法規,這對於與未來歐盟人工智慧法規相關的專案可能至關重要。

如何以及在哪裡訪問 Gemma 4

谷歌已透過多種管道提供 Gemma 4 權重,以方便開發者和研究人員使用。這些開源權重可從以下網址下載: 擁抱臉 y GitHub上同時,也可以透過介面和 API 使用。 谷歌人工智慧工作室此外,還提供整合服務。 奧拉馬Docker、Kaggle 和 LM Studio 等工具。

據該公司稱,Gemma 4 可以在本地運行。數十億台安卓設備» 並且適用於各種硬體:從 筆記型電腦顯示卡 從工作站到專用開發者加速器,應有盡有。這與將先進人工智慧從大型資料中心擴展到終端用戶設備和邊緣運算環境的策略一致。

對於想要進行快速測試的人來說,最直接的方法是使用 谷歌人工智慧工作室 適用於 26B 和 31B 型號或 Google AI Edge 圖庫 以 E2B 和 E4B 變體為例。同時,Hugging Face 等平台上的開發者社群已經開始發布針對不同環境的適配版本和即用型配置。

在西班牙和其他歐洲國家,預計本地整合商和託管服務提供者將開始提供 基於 Gemma 4 的交鑰匙解決方案結合主權雲端部署、西班牙語支援以及對特定行業法規(例如金融服務或醫療保健法規)的適應性。

總體而言,Gemma 4 的發布使Google成為該領域最重要的參與者之一。 開放且本地可執行的人工智慧模型正值歐洲工業界需要兼具高性能、數據控制和清晰許可框架的工具來建立長期商業產品之際,這種情況尤其突出。

邊緣人工智慧更注重隱私
相關文章:
邊緣人工智慧與隱私:強大的人工智慧,無需洩露您的數據