|
Cliquez sur votre fournisseur Gemini API pour afficher le contenu spécifique au fournisseur et le code sur cette page. |
Les limites de débit (communément appelées quotas) régissent le nombre de requêtes que vous pouvez envoyer à l'API Gemini dans un délai donné.Gemini API Ces limites permettent de garantir une utilisation équitable, de se protéger contre les abus et de maintenir les performances du système pour tous les utilisateurs.
Lorsque vous utilisez Firebase AI Logic pour envoyer des requêtes aux modèles Gemini et Imagen, les limites de débit de votre projet dépendent du fournisseur d' "Gemini API" que vous avez choisi. Firebase AI Logic permet également de définir des limites de débit "par utilisateur".
Afficher les limites de débit pour Gemini Developer API
Si vous dépassez votre quota ou si la capacité du modèle auquel vous accédez est épuisée, un message d'erreur 429 s'affiche.
Fonctionnement des limites de débit (quotas)
Les limites de débit (quotas) sont mesurées selon quatre dimensions :
- Requêtes par minute (RPM)
- Requêtes par jour (RPJ)
- Jetons par minute (JPM)
- Jetons par jour (JPD)
Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur 429 "Quota dépassé" est déclenchée. Par exemple, si votre limite de RPM est de 20, l'envoi de 21 requêtes en une minute générera une erreur, même si vous n'avez pas dépassé votre limite de JPM ou d'autres limites.
Les limites de débit sont appliquées au niveau du projet et s'appliquent à toutes les applications et adresses IP qui utilisent ce projet Firebase.
Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à des modèles spécifiques. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Imagen), mais sont conceptuellement similaires aux JPM.
Les limites de débit sont plus restrictives pour les modèles expérimentaux et en preview.
Demander une augmentation de la limite de débit
Si vous disposez d'un forfait payant pour le Gemini Developer API, vous pouvez demander une augmentation de la limite de débit.
Définir des limites de débit "par utilisateur"
Pour utiliser Firebase AI Logic, le fournisseur Gemini API que vous avez choisi doit être activé pour votre projet, mais vous devez également activer l'API Firebase AI Logic, qui sert de passerelle entre nos SDK clients et votre Gemini API fournisseur. Cette API est activée pour vous lorsque vous configurez Firebase AI Logic pour la première fois dans votre projet Firebase.
Vous pouvez utiliser la limite de débit (quota) de l'Firebase AI Logic API comme limite de débit "par utilisateur" pour votre application, en particulier pour les fonctionnalités d'IA qui reposent sur Firebase AI Logic. Vous devez définir cette limite de manière à ce qu'elle puisse accueillir raisonnablement un seul utilisateur accédant à vos fonctionnalités d'IA, tout en veillant à ce que aucun utilisateur ne dépasse les limites de votre Gemini API fournisseur (qui est destiné à être partagé par tous vos utilisateurs).
Informations sur la limite de débit "par utilisateur"
Voici quelques informations importantes sur les limites de débit (quotas) de l'API Firebase AI Logic, en particulier les requêtes par minute (RPM) :
Elle est basée sur les "requêtes de génération de contenu" par utilisateur, par région et par minute, et non sur le modèle.
Il s'agit de la limite de débit appliquée à tous vos utilisateurs. Pour le moment, il n'est pas possible de définir la limite de débit pour un utilisateur ou un groupe d'utilisateurs spécifiques*.
Elle s'applique au niveau du projet et à toutes les applications et adresses IP qui utilisent ce projet Firebase.
Elle s'applique à tout appel provenant spécifiquement d'un Firebase AI Logic SDK.
La limite de débit par défaut est de 100 RPM par utilisateur.
Notez que vous devez toujours tenir compte des limites de votre fournisseur Gemini API (voir ci-dessus), qui prévalent sur l'API Firebase AI Logic.
* Si vous utilisez l'Vertex AI Gemini API et que votre application redirige les utilisateurs vers différentes régions (par exemple, à l'aide de Firebase Remote Config), vous pouvez définir une limite de débit spécifique pour les utilisateurs d'une région spécifique.
Ajuster la limite de débit "par utilisateur"
Pour ajuster une limite de débit (quota), vous devez disposer de l'autorisation serviceusage.quotas.update, qui est incluse par défaut dans les rôles Propriétaire et Éditeur.
Voici comment modifier votre limite de débit (quota) ou demander une augmentation :
Dans la console Google Cloud, accédez à la page de l' Firebase AI Logic API.
Cliquez sur Gérer.
Plus bas sur la page, cliquez sur l'onglet Quotas et limites du système.
Filtrez le tableau pour afficher les quotas qui vous intéressent, comme la fonctionnalité (requêtes de génération de contenu) et la région.
Par exemple, pour afficher les quotas par utilisateur pour la génération de requêtes de contenu dans l'une des régions d'Asie compatibles, votre filtre se présente comme suit :
Generate content requests+Dimension:region:asiaCochez la case située à gauche de chaque quota qui vous intéresse.
À la fin de la ligne du quota, cliquez sur , puis sélectionnez Modifier le quota.
Dans le formulaire Modifications de quota, procédez comme suit :
Saisissez le quota augmenté dans le champ Nouvelle valeur.
Ce quota s'applique au niveau du projet et est partagé entre toutes les applications et adresses IP qui utilisent ce projet Firebase.
Renseignez tous les champs supplémentaires du formulaire, puis cliquez sur OK.
Cliquez sur Envoyer la requête.