エラーコード 429

リクエスト数がリクエストの処理に割り当てられた容量を超えると、エラーコード 429 が返されます。次の表に、各タイプの割り当てフレームワークによって生成されるエラー メッセージを示します。

割り当てフレームワーク メッセージ
従量課金制 Resource exhausted, please try again later.
プロビジョニングされたスループット Too many requests. Exceeded the Provisioned Throughput.

プロビジョニングされたスループットのサブスクリプションを使用すると、特定の生成 AI モデルのために一定量のスループットを予約できます。プロビジョニングされたスループットのサブスクリプションがなく、アプリケーションでリソースを使用できない場合、エラーコード 429 が返されます。予約済みの容量がない状況でも、再度リクエストを試すことはできます。ただし、この場合のリクエストは、サービスレベル契約(SLA)に記載されているエラー率にカウントされません。

プロビジョニングされたスループットを購入したプロジェクトの場合、Vertex AI はプロジェクトのスループットを測定し、プロジェクトの実際の使用量に対して購入したスループット量を予約します。購入したスループット量を使い切っていない場合、通常なら 429 として返されるエラーが 5XX として返され、SLA に記載されているエラー率の一部としてカウントされます。購入したスループット量を超えて使用している場合、追加のリクエストは従量課金制で処理されます。

従量課金制

従量課金制の割り当てフレームワークでは、429 エラーを解決するために次のオプションがあります。

プロビジョニングされたスループット

プロビジョニングされたスループットによって生成された 429 エラーを修正するには、次の操作を行います。

  • 予測リクエストでヘッダーを設定しないデフォルトの動作の例を使用します。超過分はオンデマンドで処理され、従量課金制で請求されます。
  • プロビジョニング スループットのサブスクリプションの GSU 数を増やします。

次のステップ