「GKE 中的 AI/機器學習自動化調度管理」說明文件

運用 Google Kubernetes Engine (GKE) 平台的自動化調度管理功能,執行最佳化的 AI/機器學習工作負載。您可以透過 Google Kubernetes Engine (GKE),導入可用於正式環境的穩固 AI/機器學習平台,同時享有代管 Kubernetes 的所有優點和以下功能:

  • 基礎架構自動化調度管理功能支援 GPU 和 TPU,可大規模處理訓練及提供模型的工作負載。
  • 能與分散式運算和資料處理架構彈性整合。
  • 以同一基礎架構支援多個團隊,讓資源獲得最大運用
本頁面將概略說明 GKE 的 AI/機器學習功能,以及如何開始在 GKE 上使用 GPU、TPU 和 Hugging Face TGI、vLLM 和 JetStream 等架構,執行最佳化的 AI/機器學習工作負載。
免費試用
  • 使用 Gemini 2.0 Flash Thinking
  • 每月免費使用熱門產品 (包括 AI API 和 BigQuery)
  • 不會自動收費,也不會要求您一定要購買特定方案
查看免費產品優惠

繼續探索 20 項以上的一律免費產品

使用超過 20 項實用的免費產品,滿足常見的使用需求,包括 AI API、VM 和資料倉儲等。

說明文件資源

歡迎查看快速入門導覽課程、指南和重要參考資料。如有常見問題,也能取得協助。
探索 Google Cloud Skills Boost 提供的自修訓練課程、用途、參考架構和程式碼範例,瞭解如何使用及連結 Google Cloud 服務。

相關影片