Ce document répertorie les quotas et limites qui s'appliquent à Model Armor.
- Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Pour en savoir plus, consultez la présentation des quotas Cloud.
Quotas de l'API Model Armor
Le tableau suivant spécifie les quotas de l'API Model Armor.
| Quota | Valeur |
|---|---|
| Requêtes API | 1 200 requêtes par minute (RPM) et par projet |
| Requêtes adressées à ExternalProcessor | 600 RPM par projet 1 |
Vous pouvez appliquer une valeur comprise entre 0 et 1 200 RPM par projet. Pour demander un ajustement, consultez Demander un ajustement de quota. Si vous avez besoin d'un quota supérieur à celui par défaut, contactez Cloud Customer Care.
Pour en savoir plus sur les quotas liés aux intégrations de Model Armor avec d'autres services, consultez Gérer les quotas.
1 Pertinent si vous intégrez Model Armor à d'autres Google Cloud services.
Limite système de la taille des entrées
Le tableau suivant spécifie la limite système concernant la taille du fichier ou du texte d'entrée. Model Armor ignore les fichiers ou le texte dépassant cette limite.
| Limite système | Valeur |
|---|---|
| Tous les fichiers compatibles et textes | 4 Mo |
Limites système de jetons
Model Armor présente différentes limites système concernant les jetons en fonction du filtre spécifique.
| Filtre | Limite système |
|---|---|
| Détection de l'injection de prompt et du jailbreaking | 10 000 |
| Une IA responsable | 10 000 |
| Contenus d'abus sexuels sur mineurs | 10 000 |
| Protection des données sensibles | 130 000 |
Lorsque le prompt ou la réponse dépasse la limite de jetons, le filtre Protection des données sensibles renvoie EXECUTION_SKIPPED. Tous les autres filtres, si le prompt ou la réponse dépasse la limite de jetons, renvoient MATCH_FOUND si du contenu malveillant est détecté dans les 10 000 premiers jetons, ou EXECUTION_SKIPPED si aucun contenu malveillant n'est détecté dans les 10 000 premiers jetons.
Obtenir les noms des métriques de quota et de limite système
Les quotas et les limites système présentent deux types de noms : les noms à afficher et les noms de métriques. Les noms à afficher contiennent des espaces et des majuscules, ce qui les rend plus faciles à lire pour les humains. Les noms de métriques sont plus susceptibles d'être en minuscules et délimités par des traits de soulignement au lieu d'espaces. Le format exact dépend du service.
Les instructions suivantes expliquent comment obtenir les noms de métriques pour les quotas et les limites système à l'aide de la console ou de gcloud CLI
Console
Dans la Google Cloud console, accédez à la page IAM et administration > Quotas et limites du système :
Accéder à la page Quotas et limites du système
Le tableau de cette page affiche les quotas et les limites système qui ont une utilisation ou des valeurs ajustées, ainsi qu'une entrée de référence pour les autres quotas. L'entrée de référence contient le mot "default" (par défaut) entre parenthèses à la fin de la liste dans la colonne Name (Nom). Par exemple,
SetIAMPolicy requests per minute per region (default)est l'entrée de référence pour le quotaSetIamPolicyRequestsPerMinutePerProject.Si la colonne Metric (Métrique) ne s'affiche pas, procédez comme suit.
- Cliquez sur Options d'affichage des colonnes.
- Sélectionnez Metric (Métrique).
- Cliquez sur OK. La colonne Metric (Métrique) s'affiche dans le tableau.
La colonne Metric (Métrique) affiche les noms des métriques. Pour filtrer les résultats, saisissez un nom ou une valeur de propriété dans le champ situé à côté de Filter (Filtre).
gcloud
Pour obtenir les noms de métriques d'un Google Cloud service à
l'aide de gcloud CLI, exécutez la quotas info list
commande. Pour ignorer les lignes qui ne listent pas les noms de métriques, transmettez la sortie à une
commande telle que grep avec metric: comme terme de recherche, ou utilisez l'
indicateur
--format de gcloud CLI :
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Remplacez les éléments suivants :
PROJECT_ID_OR_NUMBER: ID ou numéro du projet.SERVICE_NAME: nom du service dont vous souhaitez afficher les métriques de quota. Par exemple, le nom de service pour Compute Engine estcompute.googleapis.com. Incluez la partiegoogleapis.comdu nom du service.