Google Cloud 推出 Serverless for Apache Spark,支援即時啟動、免叢集管理,並深度整合進 BigQuery,讓資料處理與 AI 開發更快速、更簡單。
🔍 Google Cloud Serverless for Apache Spark六大核心優勢
① 降低成本
只需為任務執行時間付費,無需預留資源或維持閒置叢集,整體成本最多可降低 60%。
② 效能提升
預覽中的 Lightning Engine 提供向量化執行與快取功能,查詢效能最多提升 3.6 倍,支援 BigQuery、GCS、Spanner 等高效連接。
③ 彈性開放
支援 Python、Java、Scala、R,整合各類儲存與開放資料格式,適用各種開發場景與工具。
④ Gemini 智能輔助
可自動生成 PySpark 程式碼並協助除錯(預覽中),協助開發者提升效率與準確度。
⑤ AI/ML 支援完善
預載主流機器學習函式庫,支援 GPU 加速,簡化分散式訓練與部署流程。
⑥ 安全完整
禁用 SSH、預設加密、支援自管金鑰與角色控管,確保資料存取安全與可追蹤。
🧩 Spark 與 BigQuery 的整合體驗
① 同一 Notebook 撰寫 SQL 與 Spark 程式碼
② 權限與角色統一,無需額外設定
③ 使用 Storage API 存取資料不需額外費用
④ 支援 Git、排程與 CI/CD 工作流程
🔗 統一的資料存取與治理
① BigLake Metastore:Spark 與 BigQuery 可共用單一資料副本
② 支援原生與開源格式資料透過 Storage Read API 存取
③ Serverless Spark 使用 Storage API 讀取資料不額外收費
⚙️ 輕鬆導入企業流程
① 整合 Git-based CI/CD 工作流程
② 支援 BigQuery Pipelines 與任務排程
③ BigQuery 花費型 CUD 折扣也適用於 Spark 使用量