|
Kliknij swojego Gemini API dostawcę, aby wyświetlić na tej stronie treści i kod dostawcy. |
Limity częstotliwości (zwykle nazywane limitami) regulują liczbę żądań, które możesz wysłać do Gemini API w określonym przedziale czasu. Te limity pomagają zapewnić sprawiedliwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.
Gdy używasz Firebase AI Logic do wysyłania żądań do modeli Gemini i Imagen, limity szybkości w Twoim projekcie zależą od wybranego dostawcy „Gemini API”. Firebase AI Logic umożliwia też ustawianie limitów liczby wiadomości na użytkownika.
Wyświetlanie limitów żądań dla Gemini Developer API
Jeśli przekroczysz limit lub jeśli pojemność modelu, do którego uzyskujesz dostęp, zostanie wyczerpana, otrzymasz komunikat o błędzie 429.
Jak działają limity (limity wykorzystania)
Limity szybkości (limity) są mierzone w 4 wymiarach:
- Żądania na minutę (RPM)
- Żądania dziennie (RPD)
- Tokeny na minutę (TPM)
- Tokeny dziennie (TPD)
Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd 429 (przekroczony limit). Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity liczby żądań są stosowane na poziomie projektu i dotyczą wszystkich aplikacji oraz adresów IP, które korzystają z tego projektu w Firebase.
Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które potrafią generować obrazy (Imagen), ale jest podobna do liczby tokenów na minutę.
W przypadku modeli eksperymentalnych i wersji zapoznawczych limity liczby żądań są bardziej restrykcyjne.
Wysyłanie prośby o zwiększenie limitu częstotliwości
Jeśli korzystasz z Gemini Developer API w ramach „płatnego pakietu”, możesz poprosić o zwiększenie limitu.
Ustawianie limitów „na użytkownika”
Aby korzystać z usługi Firebase AI Logic, musisz mieć włączonego wybranego dostawcę Gemini API, ale także włączony interfejs Firebase AI Logic API, który działa jako brama między naszymi pakietami SDK klienta a dostawcą Gemini API. Ten interfejs API jest włączany podczas wstępnej konfiguracjiFirebase AI Logic w projekcie w Firebase.
Możesz użyć limitu liczby żądań interfejsu API Firebase AI Logic jako limitu liczby żądań „na użytkownika” w przypadku aplikacji, zwłaszcza w przypadku funkcji AI, które korzystają z Firebase AI Logic. Ustaw ten limit na rozsądnym poziomie, aby umożliwić pojedynczemu użytkownikowi dostęp do funkcji opartych na AI, a jednocześnie zapewnić, że żaden użytkownik nie przekroczy limitów Twojego dostawcy Gemini API (który jest przeznaczony dla wszystkich użytkowników).
Szczegółowe informacje o limicie „na użytkownika”
Oto kilka ważnych informacji o limitach szybkości interfejsu API – w szczególności o liczbie żądań na minutę:Firebase AI Logic
Jest ona obliczana na podstawie „Żądań generowania treści” w przypadku każdego użytkownika w każdym regionie na minutę i nie zależy od modelu.
Jest to limit liczby wiadomości na minutę, który obowiązuje wszystkich użytkowników. Obecnie nie ma możliwości ustawienia limitu szybkości dla konkretnego użytkownika lub konkretnej grupy użytkowników*.
Ma zastosowanie na poziomie projektu i obejmuje wszystkie aplikacje oraz adresy IP, które korzystają z tego projektu w Firebase.
Dotyczy to każdego wywołania, które pochodzi z dowolnego pakietu SDK.Firebase AI Logic
Domyślny limit to 100 zapytań na minutę na użytkownika.
Pamiętaj, że nadal musisz uwzględniać limity swojego dostawcy Gemini API (patrz wyżej), które mają pierwszeństwo przed interfejsem API Firebase AI Logic.
* Jeśli korzystasz z Vertex AI Gemini API, a Twoja aplikacja kieruje użytkowników do różnych regionów (np. za pomocą Firebase Remote Config), możesz ustawić określony limit żądań dla użytkowników w danym regionie.
Dostosowywanie limitu „na użytkownika”
Aby dostosować limit szybkości (limit), musisz mieć uprawnienie serviceusage.quotas.update, które jest domyślnie przyznawane w ramach ról Właściciel i Edytujący.
Aby edytować limit szybkości (limit) lub poprosić o jego zwiększenie:
W konsoli Google Cloud otwórz stronę Firebase AI Logic API.
Kliknij Zarządzaj.
W dolnej części strony kliknij kartę Limity przydziału i limity systemu.
Przefiltruj tabelę, aby wyświetlić interesujące Cię limity, np. dotyczące możliwości (prośby o wygenerowanie treści) i regionu.
Jeśli na przykład chcesz wyświetlić limity dotyczące żądań generowania treści dla poszczególnych użytkowników w dowolnym z obsługiwanych regionów Azji, Twój filtr będzie wyglądać podobnie do tego:
.Generate content requests+Dimension:region:asiaZaznacz pole wyboru po lewej stronie każdego limitu, który Cię interesuje.
Na końcu wiersza limitu kliknij , a następnie wybierz Edytuj limit.
W formularzu Zmiany limitów wykonaj te czynności:
W polu Nowa wartość wpisz zwiększony limit.
Ten limit jest stosowany na poziomie projektu i jest wspólny dla wszystkich aplikacji i adresów IP, które korzystają z tego projektu w Firebase.
Wypełnij wszelkie dodatkowe pola w formularzu i kliknij Gotowe.
Kliknij Prześlij prośbę.