במאמר הזה מוסבר איך להשיג קיבולת כשרוצים להשתמש באפשרות של צריכת AI Hypercomputer עם הזמנות עתידיות. מידע על כל אפשרויות הקיבולת ב-AI Hypercomputer זמין במאמר בנושא סקירה כללית על קיבולת.
כדי לוודא שעומסי העבודה שלכם יקבלו את המשאבים שהם צריכים, אתם יכולים לשלוח ל-Google בקשה להזמנה עתידית. הפעולה הזו מאפשרת לכם לשריין בלוקים של קיבולת למשך זמן מוגדר, החל מתאריך ושעה ספציפיים שתבחרו. בהתאם לבקשה שלכם, Google יוצרת טיוטה של מקום שמור לעתיד. אחרי שתבדקו ותשלחו את בקשת הטיוטה הזו, ו-Compute Engine יאשר אותה, הוא ייצור באופן אוטומטי (יצירה אוטומטית) הזמנה ריקה. Google Cloud לאחר מכן, בשעת ההתחלה שבחרתם, Compute Engine יקצה את הקיבולת שביקשתם לבקשה לשמירת מקום שנוצרה אוטומטית. אחרי כן תוכלו להשתמש בשמירת המקום כדי ליצור מכונות ב-Compute Engine עד לסיום תקופת שמירת המקום.
מגבלות
בקטע הזה מוסברות ההגבלות על בקשות למקום שמור לעתיד ועל בקשות שנוצרו אוטומטית.
מגבלות על בקשות למקום שמור לעתיד
אחרי ש-Google יוצרת בשבילכם טיוטה של בקשה למקום שמור לעתיד, ההגבלות הבאות חלות:
- אי אפשר לשנות את פרטי הבקשה, כולל סוג השיתוף.
- אחרי שהבקשה נשלחת, מאושרת והסטטוס שלה משתנה ל
PROVISIONING, אי אפשר לבטל או למחוק אותה. אתם מתחייבים לשלם על הקיבולת המבוקשת החל משעת ההתחלה שצוינה בבקשה, בלי קשר לשימוש בפועל.
מגבלות על הזמנות שנוצרו אוטומטית
אחרי ש-Compute Engine יוצר מקום שמור על פי דרישה כדי לספק את הקיבולת שביקשתם, חלות המגבלות הבאות:
- אפשר להשתמש בהזמנה או לשנות אותה רק אחרי שעת ההתחלה שצוינה בבקשה.
-
אפשר לשנות את ההזמנה רק באופן הבא:
כדי לשנות מאפיינים אחרים בהזמנה, צריך לפנות לצוות ניהול החשבון.
- אי אפשר למחוק את ההזמנה באופן ידני. אם כשאתם שומרים מקום אתם מציינים שאתם לא רוצים שהשמירה תימחק אוטומטית בסוף תקופת השמירה, אתם צריכים לפנות לצוות ניהול החשבון כדי למחוק את השמירה.
לפני שמתחילים
אם עדיין לא עשיתם זאת, כדאי לעיין בהגדרות הזמינות של מכונות וירטואליות ושל אשכולות.
-
צריך לבחור את הכרטיסייה הרלוונטית לאופן שבו תכננתם להשתמש בדוגמאות בדף הזה:
המסוף
כשמשתמשים במסוף Google Cloud כדי לגשת לשירותים ולממשקי ה-API, לא צריך להגדיר אימות. Google Cloud
gcloud
במסוף Google Cloud , מפעילים את Cloud Shell.
בחלק התחתון של Google Cloud המסוף יתחיל סשן של Cloud Shell ותופיע הודעה של שורת הפקודה. Cloud Shell היא סביבת מעטפת שבה ה-CLI של Google Cloud מותקן ומוגדרים ערכים לפרויקט הקיים. הסשן יופעל תוך כמה שניות.
REST
כדי להשתמש בסביבת פיתוח מקומית בדוגמאות של API בארכיטקטורת REST שבדף הזה, צריך להשתמש בפרטי הכניסה שאתם נותנים ל-CLI של gcloud.
התקינו את ה-CLI של Google Cloud.
אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.
מידע נוסף מופיע במאמר אימות לשימוש ב-REST במסמכי האימות של Google Cloud .
התפקידים הנדרשים
כדי לקבל את ההרשאות שנדרשות ליצירת בקשה למקום שמור לעתיד, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד משתמש במקום שמור לעתיד של Compute (roles/compute.futureReservationUser) בפרויקט.
כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
התפקיד המוגדר מראש הזה כולל את ההרשאות שנדרשות ליצירת בקשה לשריין מראש מקום שמור לעתיד. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי ליצור בקשה למקום שמור לעתיד, צריך את ההרשאות הבאות:
-
כדי לאפשר ל-Compute Engine ליצור אוטומטית בקשות לשמירת מקום:
compute.reservations.createבפרויקט -
כדי ליצור בקשה למקום שמור לעתיד:
compute.futureReservations.createבפרויקט -
כדי לציין תבנית של הגדרות מכונה:
compute.instanceTemplates.useReadOnlyבתבנית של הגדרות המכונה
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
מכסה
במסגרת תהליך הבקשה למקום שמור לעתיד, Google מנהלת את המכסה של המשאבים השמורים. אין צורך לבקש מכסה. בשעת ההתחלה של המקום השמור לעתיד שאושר, Google מגדילה אוטומטית את המכסה אם בפרויקט אין מספיק משאבים שמורים.
סקירה כללית
כדי לשריין בלוקים של קיבולת, פועלים לפי השלבים הבאים:
- בקשת קיבולת דרך צוות ניהול החשבון כדי לציין את הסוג ואת מספר המשאבים שרוצים לשריין, צריך לפנות לצוות ניהול החשבון.
- בדיקה ושליחה של בקשת הזמנה בטיוטה אחרי ש-Google יוצרת טיוטה של בקשה לשמירת מקום לעתיד, בודקים אותה. אם הכל נראה תקין, שולחים את הבקשה לבדיקה. Google Cloud מאשרת את הבקשה באופן מיידי.
בקשת קיבולת דרך צוות ניהול החשבון
כדי ש-Google תיצור טיוטה של בקשה למקום שמור לעתיד, צריך לפנות לצוות ניהול החשבון ולספק את הפרטים הבאים:
- מספר הפרויקט: מספר הפרויקט שבו צוות ניהול החשבון יוצר את הבקשה ו-Compute Engine מקצה את הקיבולת.
- Machine type: סוג המכונה שרוצים לשריין. אפשר לציין אחת מהאפשרויות הבאות:
- A4X Max (
a4x-maxgpu-4g-metal) - A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 High (
a3-highgpu-8g)
- A4X Max (
- Zone: התחום שבו רוצים לשמור קיבולת. כדי לראות את האזורים והתחומים שבהם זמין סוג מכונת GPU, אפשר לעיין בזמינות של מאיצים.
- המספר הכולל: המספר הכולל של מופעי מחשוב שרוצים לשריין. אפשר להזמין רק מכונות וירטואליות בכפולות של שתיים. גודלי הבלוקים ומספר מכונות ה-Compute לכל בלוק משתנים בהתאם לסוג המכונה ולזמינות שלה. צוות ניהול החשבון יכול לספק פרטים נוספים לגבי הבקשה.
- שעת התחלה: שעת ההתחלה של תקופת השמירה. אפשר להתחיל להשתמש בקיבולת המוזמנת באותו זמן. מעצבים את שעת ההתחלה כחותמת זמן בפורמט RFC 3339 באופן הבא:
YYYY-MM-DDTHH:MM:SSOFFSET
מחליפים את מה שכתוב בשדות הבאים:
-
YYYY-MM-DD: תאריך בפורמט של שנה בת 4 ספרות, חודש בן 2 ספרות ויום בחודש בן 2 ספרות, מופרדים במקפים (-). -
HH:MM:SS: שעה בפורמט של שעה בת 2 ספרות בשיטת 24 שעות, דקות בנות 2 ספרות ושניות בנות 2 ספרות, מופרדות באמצעות נקודתיים (:). -
OFFSET: אזור הזמן בפורמט של היסט מ-זמן אוניברסלי מתואם (UTC). לדוגמה, כדי להשתמש בשעון החוף המערבי (PST), מציינים-08:00. כדי לא להשתמש בהזחה, מצייניםZ.
-
- End time: שעת הסיום של שמירת המקום. הפורמט צריך להיות חותמת זמן RFC 3339. בשלב הזה, Compute Engine מבצע את הפעולות הבאות:
- המערכת של Compute Engine תמחק את הבקשה שנוצרה אוטומטית.
- בהתאם ל פעולת הסיום שציינתם עבור מכונות החישוב, מערכת Compute Engine מפסיקה או מוחקת את כל מכונות החישוב שיצרתם באמצעות בקשת ההזמנה שנוצרה אוטומטית.
- Reservation name: השם של המקום השמור ש-Compute Engine יוצר כדי לספק את הקיבולת השמורה. Compute Engine יכול ליצור רק שמירת מקום עם טירגוט ספציפי.
- מחיקה אוטומטית של שמירת מקום: האם רוצים ש-Compute Engine ימחק אוטומטית את שמירת המקום שנוצרה אוטומטית בסוף תקופת שמירת המקום. אם רוצים למחוק את ההזמנה באופן ידני, צריך לפנות לצוות ניהול החשבון כדי למחוק את ההזמנה.
- סוג תזמון התחזוקה: איך Compute Engine מתזמן תחזוקת מארח עבור מופעי החישוב באשכול. מציינים אחת מהאפשרויות הבאות:
- כדי לסנכרן את התחזוקה בכל המקרים של A4X Max, A4X, A4 או A3 Ultra בבלוקים השמורים, משתמשים ב-
GROUPED. - כדי להשתמש בלוחות זמנים שונים לתחזוקה של מופעי A4 או A3 Ultra, משתמשים ב-
INDEPENDENT.
- כדי לסנכרן את התחזוקה בכל המקרים של A4X Max, A4X, A4 או A3 Ultra בבלוקים השמורים, משתמשים ב-
- מצב הפעולה של ההזמנה: האם אתם או Google Cloud מנהלים את תהליך השחזור של מופע המחשוב אחרי שגיאה במארח או דוח מארח שגוי. השיטה שבה משתמשים תלויה בסוג המכונה שאתם מזמינים:
- כל מצב הקיבולת (
ALL_CAPACITY). המצב הזה מיועד רק לסוגי מכונות A4X Max ו-A4X. אתם צריכים לנהל ידנית את תהליך התחזוקה והשחזור של מופע מחשוב. עם זאת, יש לכם גישה מלאה לכל המכונות בהזמנה, וגם שליטה מדויקת יותר בטופולוגיה של מופע החישוב ובתחזוקה שלו. - מצב מנוהל (
HIGHLY_AVAILABLE_CAPACITY). המצב הזה מיועד רק לסוגי מכונות A4, A3 Ultra, A3 Mega ו-A3 High. אתם מאפשרים ל- Google Cloud לנהל את תהליך התחזוקה והשחזור של מופע מחשוב על ידי החלפה אוטומטית של מכונות פגומות. הגישה הזו מגדילה את הזמינות של מופעי המחשוב ועוזרת להפעיל אותם מחדש במהירות במארחים חדשים. עם זאת, יכול להיות שהטופולוגיה של מופעי המחשוב תשתנה אחרי ש-Compute Engine יחליף מכונה.
- כל מצב הקיבולת (
- Share type (סוג השיתוף): האם רק הפרויקט שלכם יכול להשתמש בהזמנה שנוצרה אוטומטית (
LOCAL), או שפרויקטים אחרים יכולים להשתמש בהזמנה (SPECIFIC_PROJECTS). אי אפשר לשנות את המאפיין הזה אחרי ששולחים את הבקשה. כדי לשתף את הקיבולת השמורה עם פרויקטים אחרים בארגון, צריך לבצע את הפעולות הבאות:- אם עדיין לא עשיתם זאת, ודאו שלפרויקט שבו Google יוצרת את הבקשה יש הרשאה ליצור הזמנות משותפות.
- מציינים את מספרי הפרויקטים שרוצים לשתף איתם את הקיבולת השמורה. אפשר לציין עד 100 פרויקטים בארגון.
שם ההתחייבות: אם תקופת ההזמנה היא שנה או יותר, אתם צריכים לרכוש התחייבות מבוססת-משאבים ולצרף אותה למשאבים שהזמנתם. אם תקופת ההזמנה היא משנה אחת ועד פחות מ-3 שנים, ההתחייבות מזכה אתכם בשיעור ההנחה של CUD לשנה אחת. לתקופות הזמנה של 3 עד 6 שנים, ההתחייבות מעניקה לכם את שיעור ההנחה של CUD ל-3 שנים.
אם משתפים את הקיבולת השמורה עם פרויקטים אחרים, הפרויקטים האלה מקבלים הנחות רק אם הם משתמשים באותו חשבון לחיוב ב-Cloud כמו הפרויקט שבו שמרתם את הקיבולת. פרטים נוספים זמינים במאמר הפעלת שיתוף של הנחות תמורת התחייבות לשימוש במשאבים.
תאריכי ההתחלה והסיום של ההתחייבות זהים לאלה של ההזמנה, אבל יכול להיות שזמני ההפעלה שונים. אם תגדירו את שעת ההתחלה של ההזמנה כ-00:00 לפי שעון החוף המערבי בארה"ב ובקנדה, ההתחייבות תהפוך לפעילה בשעה 00:00 בתאריך ההתחלה שתבחרו. אם מציינים שעת התחלה אחרת, ההתחייבות מתחילה לפעול בחצות (00:00) ביום שאחרי תאריך ההתחלה שנבחר.
אחרי ש-Google תיצור את טיוטת הבקשה למקום שמור לעתיד, צוות ניהול החשבון ייצור איתכם קשר.
בדיקה ושליחה של בקשת הזמנה בטיוטה
אחרי שתספקו לצוות ניהול החשבון את סוג המשאבים ואת הכמות שאתם רוצים לשריין, Google תיצור טיוטה של בקשה למקום שמור לעתיד. אתם יכולים לבדוק את בקשת הטיוטה, ואם היא נכונה, לשלוח אותה לבדיקה. צריך לשלוח את הבקשה לפני שעת ההתחלה של הבקשה.
כדי לבדוק ולשלוח טיוטה של בקשה למקום שמור לעתיד, בוחרים באחת מהאפשרויות הבאות:
המסוף
פותחים את הדף Reservations במסוף Google Cloud .
- לוחצים על הכרטיסייה Future reservations. בטבלה Future Reservations מפורטת כל בקשה לשריון מקום שמור לעתיד בפרויקט, וכל עמודה בטבלה מתארת מאפיין.
- בעמודה Name, לוחצים על השם של בקשת הטיוטה ש-Google יצרה בשבילכם. ייפתח דף עם הפרטים של בקשת המקום השמור לעתיד.
- בקטע מידע בסיסי, מוודאים שפרטי הבקשה, כמו תאריכים וסוג השיתוף, נכונים. בנוסף, אם ביקשתם התחייבות, ודאו שהיא מצוינת. אם פרט כלשהו מהפרטים שמצוינים למעלה לא נכון, צריך לפנות לצוות ניהול החשבון שלכם.
אם הכל נראה מדויק, שולחים את הבקשה:
- לוחצים על עריכת הטיוטה. יופיע דף שבו אפשר לשנות את בקשת הטיוטה.
- לוחצים על יצירה. ייפתח הדף Reservation. Google Cloud מאשר את הבקשה תוך כמה דקות, ואז Compute Engine יוצר שמירת מקום ריקה עם המשאבים שביקשתם.
gcloud
- כדי לראות רשימה של בקשות למקומות שמורים לעתיד בפרויקט, משתמשים בפקודה
gcloud compute future-reservations listעם האפשרות--filterשמוגדרת לערךPROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- בפלט פקודה, מחפשים את בקשת השמירה עם השם שסיפקתם לצוות ניהול החשבון שלכם.
- כדי לראות את הפרטים של בקשת הטיוטה, משתמשים בפקודה
gcloud compute future-reservations describe:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONEמחליפים את מה שכתוב בשדות הבאים:
-
FUTURE_RESERVATION_NAME: השם של בקשת המקום השמור לעתיד בסטטוס טיוטה. -
ZONE: האזור שבו Google יצרה את הבקשה.
הפלט אמור להיראות כך:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b -
- בפלט של הפקודה, מוודאים שפרטי הבקשה, כמו תקופת ההזמנה וסוג השיתוף, נכונים. בנוסף, אם רכשתם התחייבות, ודאו שהיא מצוינת. אם הפרטים שגויים, צריך לפנות לצוות ניהול החשבון.
- כדי לשלוח את בקשת הטיוטה לבדיקה, משתמשים בפקודה
gcloud compute future-reservations updateעם הדגל--planning-statusשמוגדר לערךSUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONEתוך כמה דקות, Google Cloud מאשר את הבקשה, ואז Compute Engine יוצר בקשה ריקה לשמירת מקום עם המשאבים שביקשתם.
REST
- כדי לראות רשימה של בקשות למקומות שמורים לעתיד בפרויקט, שולחים בקשת
GETאל ה-methodfutureReservations.list. בכתובת ה-URL של הבקשה, כוללים את פרמטר השאילתהfilterומגדירים אותו לערךstatus.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: המזהה של הפרויקט שבו Google יצרה את בקשת הטיוטה להזמנה עתידית. -
ZONE: האזור שבו הבקשה קיימת.
-
- בפלט של הבקשה, מחפשים את בקשת ההזמנה עם השם שסיפקתם לצוות ניהול החשבון.
- כדי לראות את פרטי בקשת הטיוטה, שולחים בקשת
GETל-methodfutureReservations.getבגרסת בטא:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
מחליפים את
FUTURE_RESERVATION_NAMEבשם של טיוטת הבקשה להזמנה עתידית.הפלט אמור להיראות כך:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - בפלט, מוודאים שפרטי הבקשה, כמו תקופת ההזמנה וסוג השיתוף, נכונים. בנוסף, אם ביקשתם התחייבות, ודאו שהיא צוינה. אם הפרטים שגויים, צריך לפנות לצוות ניהול החשבון.
- כדי לשלוח את טיוטת הבקשה לבדיקה, צריך לשלוח בקשת
PATCHל-methodfutureReservations.updatebeta. בכתובת ה-URL של הבקשה, כוללים את פרמטר השאילתהupdateMaskומגדירים אותו לערךplanningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }תוך כמה דקות, Google Cloud מאשר את הבקשה, ואז Compute Engine יוצר בקשה ריקה לשמירת מקום עם המשאבים שביקשתם.