|
Gemini API プロバイダをクリックして、このページでプロバイダ固有のコンテンツとコードを表示します。 |
レート制限(一般に割り当てと呼ばれます)は、特定の期間内に Gemini API に対して行うことができるリクエストの数を規制します。この制限は、公正な使用を確保し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。
Firebase AI Logic を使用して Gemini と Imagen モデルにリクエストを送信する場合、プロジェクトのレート制限は選択した 「Gemini API」プロバイダによって異なります。Firebase AI Logic には、 「ユーザーごと」のレート制限を設定する方法もあります。
のレート制限を表示する Gemini Developer API
割り当てを超えた場合や、アクセスしているモデルの容量が不足した場合は、429 エラー メッセージ が表示されます。
レート制限(割り当て)の仕組み
レート制限(割り当て)は、次の 4 つのディメンションで測定されます。
- 1 分あたりのリクエスト数(RPM)
- 1 日あたりのリクエスト数(RPD)
- 1 分あたりのトークン数(TPM)
- 1 日あたりのトークン数(TPD)
使用量は各上限に対して評価され、いずれかを超えると 429 割り当て超過エラーが発生します。たとえば、RPM の上限が 20 の場合、1 分以内に 21 件のリクエストを行うと、TPM やその他の上限を超えていない場合でもエラーが発生します。
レート制限はプロジェクト レベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスに適用されます。
上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Imagen)でのみ 計算されますが、概念的には TPM と 似ています。
試験運用版モデルとプレビュー モデルでは、レート制限が厳しくなります。
レート制限の引き上げをリクエストする
Gemini Developer API の「有料階層」をご利用の場合は、 レート制限の引き上げをリクエストできます。
「ユーザーごと」のレート制限を設定する
Firebase AI Logic を使用するには、選択した Gemini API プロバイダを有効にする必要があります。また、クライアント SDK と Gemini API プロバイダ間のゲートウェイとして機能する Firebase AI Logic API も有効にする必要があります。この API は、Firebase プロジェクトで Firebase AI Logicを最初に設定するときに有効になります。
アプリの「ユーザーごと」のレート制限として、Firebase AI Logic API のレート制限(割り当て)を使用できます。特に、Firebase AI Logic に依存する AI 機能の場合に有効です。この上限は、1 人のユーザーが AI 機能にアクセスするのに十分な範囲で 設定する必要があります。また、1 人のユーザーが Gemini API プロバイダの上限(すべてのユーザーで 共有されることを想定)を超えないようにする必要があります。
「ユーザーごと」のレート制限の詳細
Firebase AI Logic API のレート制限(割り当て)に関する重要な詳細(特に 1 分あたりのリクエスト数(RPM))は次のとおりです。
これは、ユーザーごと、リージョンごと、1 分あたりの「コンテンツ生成リクエスト」に基づいており、モデルには基づいていません。
これは、すべてのユーザーに適用されるレート制限です。 現時点では、特定のユーザーまたは 特定のユーザー グループのレート制限を設定する方法はありません *。
これはプロジェクト レベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスに適用されます。
これは、 Firebase AI Logic SDK から送信されるすべての呼び出しに適用されます。
デフォルトのレート制限は、ユーザーあたり 100 RPM です。
なお、 Gemini API プロバイダの上限(上記を参照)も考慮する必要があります。 この上限は、Firebase AI Logic API よりも優先されます。
* Vertex AI Gemini API を使用していて、アプリがユーザーを異なるリージョンに誘導する場合(Firebase Remote Configを使用するなど)、特定のリージョンのユーザーに特定のレート制限を設定できます。 Vertex AI Gemini API
「ユーザーごと」のレート制限を調整する
レート制限(割り当て)を調整するには、serviceusage.quotas.update 権限が必要です。この権限は、デフォルトでオーナーと編集者のロールに含まれています。
レート制限(割り当て)を編集または引き上げをリクエストする方法は次のとおりです。
Google Cloud コンソールで、 Firebase AI Logic API のページに移動します。
[管理] をクリックします。
ページの下部にある [割り当てとシステム上限] タブをクリックします。
テーブルをフィルタして、機能(コンテンツ生成のリクエスト)やリージョンなど、目的の割り当てを表示します。
たとえば、サポートされているアジアのいずれかのリージョンでコンテンツ生成リクエストのユーザーごとの割り当てを表示するには、フィルタを次のように設定します。 次のように設定します。
Generate content requests+Dimension:region:asia目的の割り当ての左側にあるチェックボックスをオンにします。
割り当ての行の末尾にある をクリックし、[**割り当てを編集**]を選択します。
[割り当ての変更] フォームで、次の操作を行います。
[新しい値 ] フィールドに、引き上げ後の割り当てを入力します。
この割り当てはプロジェクト レベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。
フォームのその他のフィールドに入力して、[完了] をクリックします。
[リクエストを送信] をクリックします。