Quotas et limites du système

Ce document répertorie les quotas et limites qui s'appliquent à Model Armor.

  • Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
  • Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Pour en savoir plus, consultez la présentation des quotas Cloud.

Quotas de l'API Model Armor

Le tableau suivant spécifie les quotas de l'API Model Armor.

Quota Valeur
Requêtes API 1 200 requêtes par minute (RPM) et par projet
Requêtes adressées à ExternalProcessor 600 RPM par projet 1

Vous pouvez appliquer une valeur comprise entre 0 et 1 200 RPM par projet. Pour demander un ajustement, consultez Demander un ajustement de quota. Si vous avez besoin d'un quota supérieur à celui par défaut, contactez Cloud Customer Care.

Pour en savoir plus sur les quotas liés aux intégrations de Model Armor avec d'autres services, consultez Gérer les quotas.

1 Pertinent si vous intégrez Model Armor à d'autres Google Cloud services.

Limite système de la taille des entrées

Le tableau suivant spécifie la limite système concernant la taille du fichier ou du texte d'entrée. Model Armor ignore les fichiers ou le texte dépassant cette limite.

Limite système Valeur
Tous les fichiers compatibles et textes 4 Mo

Limites système de jetons

Model Armor présente différentes limites système concernant les jetons en fonction du filtre spécifique.

Filtre Limite système
Détection de l'injection de prompt et du jailbreaking 10 000
Une IA responsable 10 000
Contenus d'abus sexuels sur mineurs 10 000
Protection des données sensibles 130 000

Lorsque le prompt ou la réponse dépasse la limite de jetons, le filtre Protection des données sensibles renvoie EXECUTION_SKIPPED. Tous les autres filtres, si le prompt ou la réponse dépasse la limite de jetons, renvoient MATCH_FOUND si du contenu malveillant est détecté dans les 10 000 premiers jetons, ou EXECUTION_SKIPPED si aucun contenu malveillant n'est détecté dans les 10 000 premiers jetons.

Obtenir les noms des métriques de quota et de limite système

Les quotas et les limites système présentent deux types de noms : les noms à afficher et les noms de métriques. Les noms à afficher contiennent des espaces et des majuscules, ce qui les rend plus faciles à lire pour les humains. Les noms de métriques sont plus susceptibles d'être en minuscules et délimités par des traits de soulignement au lieu d'espaces. Le format exact dépend du service.

Les instructions suivantes expliquent comment obtenir les noms de métriques pour les quotas et les limites système à l'aide de la console ou de gcloud CLI

Console

  1. Dans la Google Cloud console, accédez à la page IAM et administration > Quotas et limites du système :

    Accéder à la page Quotas et limites du système

    Le tableau de cette page affiche les quotas et les limites système qui ont une utilisation ou des valeurs ajustées, ainsi qu'une entrée de référence pour les autres quotas. L'entrée de référence contient le mot "default" (par défaut) entre parenthèses à la fin de la liste dans la colonne Name (Nom). Par exemple, SetIAMPolicy requests per minute per region (default) est l'entrée de référence pour le quota SetIamPolicyRequestsPerMinutePerProject.

  2. Si la colonne Metric (Métrique) ne s'affiche pas, procédez comme suit.

    1. Cliquez sur Options d'affichage des colonnes.
    2. Sélectionnez Metric (Métrique).
    3. Cliquez sur OK. La colonne Metric (Métrique) s'affiche dans le tableau.

La colonne Metric (Métrique) affiche les noms des métriques. Pour filtrer les résultats, saisissez un nom ou une valeur de propriété dans le champ situé à côté de Filter (Filtre).

gcloud

Pour obtenir les noms de métriques d'un Google Cloud service à l'aide de gcloud CLI, exécutez la quotas info list commande. Pour ignorer les lignes qui ne listent pas les noms de métriques, transmettez la sortie à une commande telle que grep avec metric: comme terme de recherche, ou utilisez l' indicateur --format de gcloud CLI :

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Remplacez les éléments suivants :

  • PROJECT_ID_OR_NUMBER: ID ou numéro du projet.
  • SERVICE_NAME: nom du service dont vous souhaitez afficher les métriques de quota. Par exemple, le nom de service pour Compute Engine est compute.googleapis.com. Incluez la partie googleapis.com du nom du service.