大綱
Gemma 2現已向全球研究人員和開發者正式發布。Gemma 2採用了最先進的技術,提供卓越的性能表現,並在不同硬件上運行速度快,易於與其他人工智能工具整合。
Gemma 2有兩個版本,分別擁有90億和270億個參數。相比第一代,Gemma 2在推理效率上更高效,並且內建了重要的安全功能。特別是在270億個參數規模下,它不僅提供了優秀的性能,還能與兩倍大小的專有模型競爭,並僅需單個NVIDIA H100 Tensor Core GPU或TPU主機即可實現,大大降低了部署成本。
Gemma 2的設計重點在於卓越的性能和推理效率。它在各種硬件上運行速度極快,從強大的遊戲筆記本和高端桌面電腦,到基於雲的配置都能輕鬆應對。您可以在Google AI Studio中全精度試用Gemma 2,使用Gemma.cpp在CPU上解鎖本地性能,或者通過Hugging Face Transformers在家用電腦上試用NVIDIA RTX或GeForce RTX的量化版本。
此外,Gemma 2設計成更易於整合到開發人員和研究人員的工作流程中。它採用商業友好的Gemma許可證,可以與主流的AI框架(如Hugging Face Transformers,JAX,PyTorch和TensorFlow)輕鬆兼容。未來,Google Cloud客戶還可以在Vertex AI上輕鬆部署和管理Gemma 2。
Gemma 2不僅更強大,還致力於更高效的AI部署,為開發者和研究人員提供了更多創建和部署AI應用的可能性。
摘要
- Gemma 2現已全球發布,提供9B和27B兩種參數大小的模型。
- 新架構設計讓Gemma 2在推理效率和性能上均有顯著提升。
- 在單個NVIDIA H100 Tensor Core GPU或TPU主機上運行,大幅降低部署成本。
- 支援多種硬體環境,包括Google AI Studio、NVIDIA RTX等,極大地提升推理速度。
- 可與Hugging Face Transformers、JAX、PyTorch等主要AI框架兼容,易於整合到開發工作流程中。
- 提供開放和商業友好的Gemma許可,方便開發者和研究人員分享和商業化創新。
- 強調負責任的AI開發,包括公開的LLM比較器和SynthID技術,幫助評估和減少模型可能存在的偏見和風險。
- Gemma 2已用於眾多專案,如Navarasa,旨在推動多樣化語言的發展。
結論
Gemma 2 正式推出,為全球的研究人員與開發者帶來了前所未有的性能和效率。無論是其卓越的推論速度、與各種硬體的完美兼容,抑或是易於與其他人工智慧工具整合,Gemma 2 都展現了其領先的地位。這不僅是技術上的進步,更是讓更多人能夠參與並受益於人工智慧發展的重要一步。
連結
https://blog.google/technology/developers/google-gemma-2
導入實例
其中一個Navarasa專案即利用Gemma來建立一個支援多元化印度語言的微調模型。