Pour que vos instances Google Cloud Managed Lustre restent à jour, Google Cloudeffectue régulièrement des opérations de maintenance sur celles-ci. Ces opérations peuvent inclure des mises à jour du logiciel ou de l'infrastructure sous-jacents. Elles peuvent entraîner un temps d'arrêt temporaire, pendant lequel les opérations d'E/S vers l'instance peuvent cesser de répondre. Les opérations d'E/S concernées reprennent une fois la maintenance terminée. Le temps d'arrêt est généralement compris entre 2 et 25 minutes.
Pendant la maintenance, l'état d'une instance est UPGRADING. Une fois la maintenance terminée, l'instance revient à l'état ACTIVE.
Les règles de maintenance vous permettent de contrôler le moment où ces événements de maintenance se produisent. Vous pouvez configurer une règle de maintenance pour chaque instance afin de spécifier des intervalles de maintenance et des périodes pendant lesquelles la maintenance doit être exclue. Si aucune règle de maintenance n'est configurée sur une instance, la maintenance peut avoir lieu à tout moment.
Vous pouvez également reprogrammer un événement de maintenance pour qu'il commence immédiatement, lors du prochain intervalle disponible ou à une heure spécifique jusqu'à 28 jours plus tard.
Instances à très grande échelle
Certaines configurations Managed Lustre offrant des performances et une évolutivité extrêmes peuvent nécessiter un temps d'arrêt planifié pouvant aller jusqu'à quatre heures pour la maintenance périodique des hôtes. Google vous informe à l'avance de ces événements de maintenance.
À propos des règles de maintenance
Vous pouvez configurer une stratégie de maintenance sur chaque instance Managed Lustre. Une stratégie de maintenance inclut les éléments suivants :
- Intervalle de maintenance hebdomadaire : intervalle récurrent d'une heure pendant la semaine où Managed Lustre peut commencer un événement de maintenance.
- Période d'exclusion de maintenance : période pendant laquelle Managed Lustre n'est pas autorisé à lancer un événement de maintenance. Vous pouvez définir une fenêtre d'exclusion par instance, avec une durée maximale de deux semaines. Si aucune année n'est spécifiée dans les dates de début et de fin, l'intervalle d'exclusion se répète chaque année.
Une période d'exclusion prévaut sur un intervalle de maintenance régulier. Si un événement planifié se produit pendant cette période, Managed Lustre le reporte au prochain intervalle disponible ou l'ignore complètement. La mise à jour est appliquée lors du prochain cycle de maintenance.
Notifications en cas de maintenance
Vous pouvez vous abonner aux notifications par e-mail pour les événements de maintenance à venir afin de vous aider à planifier toute interruption potentielle. Les abonnements aux notifications de maintenance sont gérés sur la page "Communication" de la console Google Cloud :
Accédez à la page Communication.
Une fois l'abonnement souscrit, les notifications suivantes sont envoyées :
- Notification préalable : envoyée 7 à 14 jours avant un événement de maintenance planifié ou après qu'un événement de maintenance a été reprogrammé par le client.
- Annulé : envoyé si un événement de maintenance planifié est annulé par Google ou reprogrammé par le client.
- En cours : envoyé lorsqu'un événement de maintenance commence.
- Terminé : envoyé lorsqu'un événement de maintenance est terminé.
Vous pouvez également consulter les plannings de maintenance à venir sur la page d'informations de l'instance dans la console Google Cloud ou utiliser Cloud Logging pour afficher les journaux de maintenance.
Configurer un intervalle de maintenance
Un intervalle de maintenance nécessite un jour de la semaine et une heure de début UTC pour l'intervalle d'une heure.
Console Google Cloud
Pour configurer un intervalle de maintenance lors de la création d'une instance, consultez Créer une instance.
gcloud
Créez une instance avec un intervalle de maintenance en spécifiant l'option --maintenance-policy-weekly-windows :
gcloud lustre instances create INSTANCE_ID \ --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \ --capacity-gib=CAPACITY_GIB \ --filesystem=FS_NAME \ --location=LOCATION \ --network=NETWORK_PATH \ --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'
Remplacez les éléments suivants :
- INSTANCE_ID : ID de votre instance Managed Lustre.
- PER_UNIT_STORAGE_THROUGHPUT correspond au niveau de performances en Mo/s par Tio. Les valeurs valides sont
0,125,250,500et1000. Pour spécifier le [niveau dynamique][dynamic-tier], définissez cette valeur sur0et incluez l'indicateur--dynamic-tier-options-mode=DEFAULT_CACHE. - CAPACITY : capacité de votre instance en Gio.
- FS_NAME : nom de votre système de fichiers.
- LOCATION : emplacement de votre instance Managed Lustre.
- NETWORK_PATH : chemin d'accès complet du réseau VPC auquel appartient l'instance, au format
projects/PROJECT_ID/global/networks/NETWORK. Consultez Configurer un réseau VPC. - DAY : jour de la semaine de l'intervalle de maintenance (par exemple,
TUESDAY). - START_TIME : heure de début UTC de l’intervalle de maintenance au format dictionnaire (par exemple,
{hours=1,minutes=0}).
Pour en savoir plus sur la création d'une instance, consultez Créer une instance Lustre gérée.
API REST
Pour spécifier un intervalle de maintenance pour une instance, incluez l'objet maintenancePolicy lors de la création d'une instance.
Voici un exemple d'objet maintenancePolicy :
"maintenancePolicy": {
"weeklyMaintenanceWindows": [
{
"dayOfWeek": "DAY",
"startTime": {
"hours": HOURS,
"minutes": MINUTES
}
}
]
}
Remplacez les éléments suivants :
- DAY : jour de la semaine de l'intervalle de maintenance (par exemple,
TUESDAY). - HOURS : heure de début de l'intervalle de maintenance (par exemple,
1). - MINUTES : minute de l'heure de début de l'intervalle de maintenance (par exemple,
0).
Configurer un intervalle d'exclusion
Pour éviter que la maintenance ne se produise pendant certaines périodes, comme les jours fériés ou les événements professionnels, vous pouvez définir un intervalle d'exclusion de maintenance dans votre règlement de maintenance. Les intervalles d'exclusion peuvent durer jusqu'à deux semaines. Pour créer un intervalle d'exclusion récurrent chaque année, ne spécifiez pas d'année dans les dates de début et de fin.
Vous pouvez combiner un intervalle de maintenance hebdomadaire et un intervalle d'exclusion dans la même règle.
Console Google Cloud
Pour configurer une fenêtre d'exclusion lors de la création d'une instance, consultez Créer une instance.
gcloud
Créez une instance avec une période d'exclusion en spécifiant l'option --maintenance-policy-exclusion-window :
gcloud lustre instances create INSTANCE_ID \ --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \ --capacity-gib=CAPACITY_GIB \ --filesystem=FILESYSTEM \ --location=LOCATION \ --network=NETWORK_PATH \ --maintenance-policy-exclusion-window='startDate={START_DATE},endDate={END_DATE},time={TIME}'
Remplacez les éléments suivants :
- INSTANCE_ID : ID de votre instance Managed Lustre.
- PER_UNIT_STORAGE_THROUGHPUT correspond au niveau de performances en Mo/s par Tio. Les valeurs valides sont
0,125,250,500et1000. Pour spécifier le [niveau dynamique][dynamic-tier], définissez cette valeur sur0et incluez l'indicateur--dynamic-tier-options-mode=DEFAULT_CACHE. - CAPACITY : capacité de votre instance en Gio.
- FS_NAME : nom de votre système de fichiers.
- LOCATION : emplacement de votre instance Managed Lustre.
- NETWORK_PATH : chemin d'accès complet du réseau VPC auquel appartient l'instance, au format
projects/PROJECT_ID/global/networks/NETWORK. Consultez Configurer un réseau VPC. - START_DATE : date de début de la période d'exclusion de maintenance au format dictionnaire (par exemple,
{day=08,month=06,year=2026}). Pour une récurrence annuelle, omettez la cléyear. - END_DATE : date de fin de la période d'exclusion de maintenance au format dictionnaire (par exemple,
{day=08,month=06,year=2026}). Pour une récurrence annuelle, omettez la cléyear. - TIME : heure de début et de fin UTC de la période d'exclusion au format dictionnaire (par exemple,
{hours=1,minutes=0}).
API REST
Voici un exemple d'objet maintenancePolicy avec une période d'exclusion :
"maintenancePolicy": {
"maintenanceExclusionWindow": [
{
"startDate": {
"day": START_DAY,
"month": START_MONTH,
"year": START_YEAR
},
"endDate": {
"day": END_DAY,
"month": END_MONTH,
"year": END_YEAR
},
"time": {
"hours": HOURS,
"minutes": MINUTES
}
}
]
}
Remplacez les éléments suivants :
- START_YEAR : année de la date de début de la période d'exclusion (par exemple,
2026). Omettez ce champ etEND_YEARpour créer une période récurrente annuelle. - START_MONTH : mois de la date de début de la période d'exclusion (par exemple,
12). - START_DAY : jour de la date de début de la période d'exclusion (par exemple,
24). - END_YEAR : année de la date de fin de la période d'exclusion (par exemple,
2027). Omettez ce champ etSTART_YEARpour créer une période récurrente annuelle. - END_MONTH : mois de la date de fin de la période d'exclusion (par exemple,
1). - END_DAY : jour de la date de fin de la période d'exclusion (par exemple,
7). - HOURS : heure de la journée pour la période d'exclusion (par exemple,
0). - MINUTES : minute de l'heure pour la période d'exclusion (par exemple,
0).
Mettre à jour une stratégie de maintenance
Pour ajouter ou modifier la stratégie de maintenance d'une instance existante :
Console Google Cloud
Pour mettre à jour la stratégie de maintenance d'une instance, consultez Gérer les instances.
gcloud
L'exemple gcloud suivant met à jour la stratégie de maintenance d'une instance :
gcloud lustre instances update INSTANCE_ID \ --location=LOCATION \ --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'
Remplacez les éléments suivants :
- INSTANCE_ID : ID de votre instance Managed Lustre.
- LOCATION : emplacement de votre instance Managed Lustre.
- DAY : jour de la semaine de l'intervalle de maintenance (par exemple,
TUESDAY). - START_TIME : heure de début UTC de l’intervalle de maintenance au format dictionnaire (par exemple,
{hours=1,minutes=0}).
API REST
Pour spécifier un intervalle de maintenance pour une instance, incluez l'objet maintenancePolicy lorsque vous mettez à jour une instance. Vous devez également spécifier le maintenancePolicy dans le paramètre de requête updateMask.
L'exemple curl suivant met à jour la stratégie de maintenance d'une instance :
curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"maintenancePolicy": {
"weeklyMaintenanceWindows": [
{
"dayOfWeek": "DAY",
"startTime": {
"hours": HOURS,
"minutes": MINUTES
}
}
]
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"
Remplacez les éléments suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- LOCATION Emplacement de l'instance Managed Lustre.
- INSTANCE_ID : ID de l'instance Managed Lustre.
- DAY : jour de la semaine de l'intervalle de maintenance (par exemple,
TUESDAY). - HOURS : heure de début de l'intervalle de maintenance (par exemple,
3). - MINUTES : minute de l'heure de début de l'intervalle de maintenance (par exemple,
45).
Supprimer une règle de maintenance
Pour supprimer une règle de maintenance d'une instance, effacez tous les intervalles de maintenance hebdomadaires et les intervalles d'exclusion de la règle.
Console Google Cloud
Pour supprimer une stratégie de maintenance d'une instance, modifiez l'instance et effacez les champs de stratégie de maintenance. Consultez Gérer les instances.
gcloud
Exécutez la commande gcloud lustre instances update avec les options --clear-maintenance-policy-weekly-windows et --clear-maintenance-policy-exclusion-window :
gcloud lustre instances update INSTANCE_ID \ --location=LOCATION \ --clear-maintenance-policy-weekly-windows \ --clear-maintenance-policy-exclusion-window
Remplacez les éléments suivants :
- INSTANCE_ID : ID de votre instance Managed Lustre.
- LOCATION : emplacement de votre instance Managed Lustre.
API REST
Pour supprimer une règle de maintenance à l'aide de l'API REST, utilisez la méthode instances.patch avec un objet maintenancePolicy vide et le paramètre de requête updateMask défini sur maintenancePolicy :
curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"maintenancePolicy": {}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"
Remplacez les éléments suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- LOCATION : emplacement de l'instance Managed Lustre.
- INSTANCE_ID : ID de l'instance Managed Lustre.
Afficher les journaux de maintenance
Managed Lustre utilise Cloud Logging pour consigner les événements de maintenance, y compris les types d'activités suivants :
LustreAdvancedNotification: une opération de maintenance a été planifiée pour l'instance.LustreOngoingNotification: la maintenance de l'instance a commencé. Une fois l'opération terminée, un autre événementLustreOngoingNotificationest consigné, cette fois avecis_completed=true.LustreCancelledNotification: l'opération de maintenance a été annulée.
Vous pouvez afficher les journaux de maintenance à l'aide de l'explorateur de journaux ou de Google Cloud CLI.
Explorateur de journaux
Pour afficher les journaux de maintenance de Managed Lustre à l'aide de l'explorateur de journaux, procédez comme suit :
Dans la console Google Cloud , accédez à la page Cloud Logging > Explorateur de journaux :
Saisissez le filtre suivant dans l'éditeur de requêtes, puis cliquez sur Exécuter la requête :
resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"
CLI gcloud
Pour afficher les journaux de maintenance avec Google Cloud CLI, exécutez la commande gcloud logging read :
gcloud logging read 'resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"' --project=PROJECT_ID
Remplacez les éléments suivants :
INSTANCE_ID: ID de l'instance Managed Lustre.LOCATION: zone où se trouve l'instance.PROJECT_ID: ID du projet dans lequel se trouve l'instance.
Reprogrammer la maintenance
Si un événement de maintenance planifié ne vous convient pas, vous pouvez le reprogrammer. Lorsque vous reprogrammez la maintenance, vous disposez des options suivantes :
- Immédiatement : reprogrammez l'événement de maintenance pour qu'il démarre dès que possible. Cette option ignore les intervalles et les exclusions de maintenance configurés sur l'instance.
- Prochain intervalle disponible : reprogrammez l'événement de maintenance au prochain intervalle de maintenance disponible. Cela reporte généralement la mise à jour d'une semaine.
- Par date : reprogrammez l'événement de maintenance à une date et une heure spécifiques. Vous pouvez reporter la maintenance de 28 jours maximum à compter de l'heure planifiée initialement. Cette option ignore les intervalles de maintenance et d'exclusion configurés sur l'instance.
Pour reprogrammer la maintenance :
gcloud
Pour démarrer l'événement de maintenance le plus rapidement possible :
gcloud lustre instances reschedule-maintenance INSTANCE_ID \ --location=LOCATION \ --reschedule-type=immediately
Pour reprogrammer la maintenance au prochain intervalle disponible :
gcloud lustre instances reschedule-maintenance INSTANCE_ID \ --location=LOCATION \ --reschedule-type=next-available-window
Pour reprogrammer la maintenance à un moment précis :
gcloud lustre instances reschedule-maintenance INSTANCE_ID \ --location=LOCATION \ --reschedule-type=by-time \ --reschedule-schedule-time=TIMESTAMP
Remplacez les éléments suivants :
- INSTANCE_ID : ID de votre instance Managed Lustre.
- LOCATION : emplacement de votre instance Managed Lustre.
- TIMESTAMP : heure de début au format RFC 3339 (par exemple,
2026-04-30T10:00:00Z). Elle ne doit pas être postérieure de plus de 28 jours à l'heure initialement prévue.
API REST
Exécutez la méthode instances.rescheduleMaintenance.
L'exemple curl suivant démarre l'événement de maintenance dès que possible :
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"reschedule": {
"rescheduleType": "IMMEDIATELY"
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"
L'exemple curl suivant reprogramme la maintenance au prochain intervalle disponible :
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"reschedule": {
"rescheduleType": "NEXT_AVAILABLE_WINDOW"
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"
L'exemple curl suivant replanifie la maintenance à une heure spécifique :
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"reschedule": {
"rescheduleType": "BY_TIME",
"scheduleTime": "TIMESTAMP"
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"
Remplacez les éléments suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- INSTANCE_ID : ID de votre instance Managed Lustre.
- LOCATION : emplacement de votre instance Managed Lustre.
- TIMESTAMP : heure de début au format RFC 3339 (par exemple,
2026-04-30T10:00:00Z). Elle ne doit pas être postérieure de plus de 28 jours à l'heure initialement prévue.