Gemma 2 現已可供研究人員和開發人員使用

GEMMA2

大綱

Gemma 2現已向全球研究人員和開發者正式發布。Gemma 2採用了最先進的技術,提供卓越的性能表現,並在不同硬件上運行速度快,易於與其他人工智能工具整合。

Gemma 2有兩個版本,分別擁有90億和270億個參數。相比第一代,Gemma 2在推理效率上更高效,並且內建了重要的安全功能。特別是在270億個參數規模下,它不僅提供了優秀的性能,還能與兩倍大小的專有模型競爭,並僅需單個NVIDIA H100 Tensor Core GPU或TPU主機即可實現,大大降低了部署成本。

Gemma 2的設計重點在於卓越的性能和推理效率。它在各種硬件上運行速度極快,從強大的遊戲筆記本和高端桌面電腦,到基於雲的配置都能輕鬆應對。您可以在Google AI Studio中全精度試用Gemma 2,使用Gemma.cpp在CPU上解鎖本地性能,或者通過Hugging Face Transformers在家用電腦上試用NVIDIA RTX或GeForce RTX的量化版本。

此外,Gemma 2設計成更易於整合到開發人員和研究人員的工作流程中。它採用商業友好的Gemma許可證,可以與主流的AI框架(如Hugging Face Transformers,JAX,PyTorch和TensorFlow)輕鬆兼容。未來,Google Cloud客戶還可以在Vertex AI上輕鬆部署和管理Gemma 2。

Gemma 2不僅更強大,還致力於更高效的AI部署,為開發者和研究人員提供了更多創建和部署AI應用的可能性。

摘要

  1. Gemma 2現已全球發布,提供9B和27B兩種參數大小的模型。
  2. 新架構設計讓Gemma 2在推理效率和性能上均有顯著提升。
  3. 在單個NVIDIA H100 Tensor Core GPU或TPU主機上運行,大幅降低部署成本。
  4. 支援多種硬體環境,包括Google AI Studio、NVIDIA RTX等,極大地提升推理速度。
  5. 可與Hugging Face Transformers、JAX、PyTorch等主要AI框架兼容,易於整合到開發工作流程中。
  6. 提供開放和商業友好的Gemma許可,方便開發者和研究人員分享和商業化創新。
  7. 強調負責任的AI開發,包括公開的LLM比較器和SynthID技術,幫助評估和減少模型可能存在的偏見和風險。
  8. Gemma 2已用於眾多專案,如Navarasa,旨在推動多樣化語言的發展。

結論

Gemma 2 正式推出,為全球的研究人員與開發者帶來了前所未有的性能和效率。無論是其卓越的推論速度、與各種硬體的完美兼容,抑或是易於與其他人工智慧工具整合,Gemma 2 都展現了其領先的地位。這不僅是技術上的進步,更是讓更多人能夠參與並受益於人工智慧發展的重要一步。

連結

https://blog.google/technology/developers/google-gemma-2

導入實例

其中一個Navarasa專案即利用Gemma來建立一個支援多元化印度語言的微調模型。

如果想知道更多雲端新知,加入我們LINE@官方號

感謝您的填寫,將有專人與您聯繫