Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Dataproc di GKE memungkinkan Anda menjalankan aplikasi Big Data menggunakan
jobs API Dataproc di cluster GKE.
Gunakan Konsol Google Cloud, Google Cloud CLI, atau Dataproc API
(permintaan HTTP atau Library Klien Cloud) untuk
membuat Dataproc di cluster virtual GKE,
lalu kirim tugas Spark, PySpark, SparkR, atau Spark-SQL ke layanan
Dataproc.
Dataproc on GKE men-deploy cluster virtual Dataproc di
cluster GKE. Tidak seperti
Dataproc di cluster Compute Engine,
Dataproc di cluster virtual GKE tidak menyertakan VM master dan pekerja
terpisah. Sebagai gantinya, saat Anda membuat cluster virtual Dataproc di GKE,
Dataproc di GKE akan membuat node pool dalam cluster GKE. Tugas Dataproc di GKE
dijalankan sebagai pod di node pool ini. Node pool dan penjadwalan pod di node pool dikelola oleh GKE.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-04-21 UTC."],[[["Dataproc on GKE enables the execution of Big Data applications on GKE clusters through the Dataproc `jobs` API."],["You can create a Dataproc on GKE virtual cluster and then submit Spark, PySpark, SparkR, or Spark-SQL jobs via the Google Cloud console, Cloud CLI, or the Dataproc API."],["Dataproc on GKE utilizes virtual clusters, which, unlike Dataproc on Compute Engine clusters, do not have separate master and worker VMs."],["Dataproc on GKE job are run as pods on node pools and is managed by GKE."],["Dataproc on GKE supports Spark 3.5 versions."]]],[]]