할당량 및 가격 책정

이 페이지에서는 Gemini API의 할당량 및 가격 책정 구조를 설명합니다. Vertex AI입니다.

리전 및 모델별 할당량

분당 요청 수(RPM) 할당량은 기본 모델과 해당 모델의 모든 버전, 식별자, 조정된 버전에 적용됩니다. 예를 들면 다음과 같습니다.

  • gemini-1.0-pro에 대한 요청과 gemini-1.0-pro-001에 대한 요청은 기본 모델의 RPM 할당량에 대해 두 개의 요청으로 계산됨 gemini-1.0 pro입니다.

  • gemini-1.0-pro-001에 대한 요청 및 다음과 같은 조정된 모델에 대한 요청 gemini-1.0-pro-001 기준의 경우 RPM 할당량에서 2개의 요청으로 집계됩니다. 기본 모델인 gemini-1.0-pro입니다.

이러한 할당량은 프로젝트 수준에서 적용되며 애플리케이션 및 해당 Firebase 프로젝트를 사용하는 IP 주소를 관리할 수 있습니다 또한 할당량은 모든 Gemini API 호출에 적용됩니다. Vertex AI in Firebase SDK, 서버 SDK( Gemini Firebase Extensions), REST 호출 또는 Vertex AI Studio입니다.

각 모델의 리전별 할당량 Google Cloud 문서를 참조하세요.

할당량 상향 조정 요청

Vertex AI의 할당량을 상향 조정하려면 다음을 사용하세요. Google Cloud 콘솔에서 할당량 상향 조정을 요청합니다. 할당량에 대해 자세히 알아보려면 할당량 사용을 참조하세요.



가격 책정

Vertex AIGemini API를 사용하려면 Firebase 프로젝트가 사용 사용한 만큼만 지불하는 Blaze 요금제.

모델별 가격 책정 Google Cloud 문서를 참조하세요.