AI新聞, GCP雲端

Gemma 2 現已可供研究人員和開發人員使用

大綱

Gemma 2現已向全球研究人員和開發者正式發布。Gemma 2採用了最先進的技術，提供卓越的性能表現，並在不同硬件上運行速度快，易於與其他人工智能工具整合。

Gemma 2有兩個版本，分別擁有90億和270億個參數。相比第一代，Gemma 2在推理效率上更高效，並且內建了重要的安全功能。特別是在270億個參數規模下，它不僅提供了優秀的性能，還能與兩倍大小的專有模型競爭，並僅需單個NVIDIA H100 Tensor Core GPU或TPU主機即可實現，大大降低了部署成本。

Gemma 2的設計重點在於卓越的性能和推理效率。它在各種硬件上運行速度極快，從強大的遊戲筆記本和高端桌面電腦，到基於雲的配置都能輕鬆應對。您可以在Google AI Studio中全精度試用Gemma 2，使用Gemma.cpp在CPU上解鎖本地性能，或者通過Hugging Face Transformers在家用電腦上試用NVIDIA RTX或GeForce RTX的量化版本。

此外，Gemma 2設計成更易於整合到開發人員和研究人員的工作流程中。它採用商業友好的Gemma許可證，可以與主流的AI框架（如Hugging Face Transformers，JAX，PyTorch和TensorFlow）輕鬆兼容。未來，Google Cloud客戶還可以在Vertex AI上輕鬆部署和管理Gemma 2。

Gemma 2不僅更強大，還致力於更高效的AI部署，為開發者和研究人員提供了更多創建和部署AI應用的可能性。

摘要

Gemma 2現已全球發布，提供9B和27B兩種參數大小的模型。
新架構設計讓Gemma 2在推理效率和性能上均有顯著提升。
在單個NVIDIA H100 Tensor Core GPU或TPU主機上運行，大幅降低部署成本。
支援多種硬體環境，包括Google AI Studio、NVIDIA RTX等，極大地提升推理速度。
可與Hugging Face Transformers、JAX、PyTorch等主要AI框架兼容，易於整合到開發工作流程中。
提供開放和商業友好的Gemma許可，方便開發者和研究人員分享和商業化創新。
強調負責任的AI開發，包括公開的LLM比較器和SynthID技術，幫助評估和減少模型可能存在的偏見和風險。
Gemma 2已用於眾多專案，如Navarasa，旨在推動多樣化語言的發展。

結論

Gemma 2 正式推出，為全球的研究人員與開發者帶來了前所未有的性能和效率。無論是其卓越的推論速度、與各種硬體的完美兼容，抑或是易於與其他人工智慧工具整合，Gemma 2 都展現了其領先的地位。這不僅是技術上的進步，更是讓更多人能夠參與並受益於人工智慧發展的重要一步。

連結

https://blog.google/technology/developers/google-gemma-2

導入實例

其中一個Navarasa專案即利用Gemma來建立一個支援多元化印度語言的微調模型。

Gemma 2 現已可供研究人員和開發人員使用

大綱

摘要

結論

連結

導入實例

最近貼文

Google Kubernetes Engine（GKE）的新型OpenTelemetry摘要入口管道

選擇自行託管或托管解決方案進行AI應用開發

自動化新工具：AWS Console-to-Code 將主控台操作轉換為 IaC 代碼

文章分類

追蹤我們

如果想知道更多雲端新知，加入我們LINE@官方號

感謝您的填寫，將有專人與您聯繫