Kuota alokasi


Dokumen ini mencantumkan kuota alokasi yang berlaku untuk Compute Engine.

Kuota alokasi

Kuota alokasi, juga dikenal sebagai kuota resource, menentukan jumlah resource yang dapat diakses project Anda. Compute Engine memberlakukan kuota alokasi pada penggunaan resource karena berbagai alasan. Misalnya, kuota membantu melindungi komunitas pengguna Google Cloud dengan mencegah lonjakan penggunaan yang tidak terduga. Google Cloud juga menawarkan kuota uji coba gratis yang menyediakan akses terbatas untuk project guna membantu Anda menjelajahi Google Cloud berdasarkan uji coba gratis.

Tidak semua project memiliki kuota yang sama. Seiring meningkatnya penggunaan Google Cloud dari waktu ke waktu, kuota Anda mungkin meningkat. Jika Anda memperkirakan adanya peningkatan penggunaan yang signifikan di masa mendatang, Anda dapat secara proaktif meminta penyesuaian kuota dari halaman Kuota di konsol Google Cloud.

Untuk mengetahui informasi spesifik terkait kuota untuk batas kapasitas Compute Engine API, lihat Kuota API.

Ketersediaan kuota dan resource

Kuota alokasi adalah jumlah maksimum resource yang dapat Anda buat untuk jenis resource tersebut, jika resource tersedia. Kuota tidak menjamin bahwa sumber daya akan selalu tersedia. Jika resource tidak tersedia, atau jika region yang dipilih tidak memiliki resource, Anda tidak dapat membuat resource baru dengan jenis tersebut meskipun memiliki sisa kuota di region atau project Anda. Misalnya, Anda mungkin masih memiliki kuota untuk membuat alamat IP eksternal di us-central1, tetapi mungkin tidak ada alamat IP yang tersedia di region tersebut.

Demikian pula, meskipun Anda memiliki kuota regional, resource mungkin tidak tersedia di zona tertentu. Misalnya, Anda mungkin memiliki kuota untuk membuat instance VM di region us-central1, tetapi Anda mungkin tidak dapat membuat instance VM di zona us-central1-a jika zona habis. Dalam kasus seperti itu, coba buat resource yang sama di zona lain, misalnya us-central1-f. Untuk mempelajari opsi Anda lebih lanjut jika resource zona habis, lihat dokumentasi untuk memecahkan masalah ketersediaan resource.

Kuota alokasi

Saat merencanakan kebutuhan instance VM, Anda harus mempertimbangkan beberapa kuota yang memengaruhi jumlah instance VM yang dapat dibuat.

Kuota regional dan global

Kuota VM dikelola di tingkat regional. Instance VM, grup instance, kuota disk, dan CPU dapat dipakai oleh VM mana pun di region, di mana pun zonanya. Misalnya, kuota CPU adalah kuota regional sehingga terdapat batas dan jumlah penggunaan yang berbeda untuk setiap region. Untuk meluncurkan instance n2-standard-16 di zona mana pun di region us-central1, Anda memerlukan kuota yang cukup untuk setidaknya 16 CPU dalam us-central1.

Kuota jaringan dan load balancing diperlukan untuk membuat firewall, load balancer, jaringan, dan VPN. Kuota ini adalah kuota global yang tidak bergantung pada suatu region. Setiap region dapat menggunakan kuota global. Misalnya, alamat IP eksternal yang sedang digunakan dan statis yang ditetapkan ke load balancer serta proxy HTTP dan HTTPS akan memakai kuota global.

Instance VM

Kuota instance VM adalah kuota regional dan membatasi jumlah instance VM yang ada di region tertentu, terlepas dari apakah VM berjalan atau tidak. Kuota ini dapat dilihat di konsol Google Cloud di halaman Kuota. Compute Engine secara otomatis menetapkan kuota ini sebesar 10 kali kuota CPU reguler Anda. Anda tidak perlu meminta kuota ini. Jika Anda memerlukan kuota untuk lebih banyak instance VM, minta lebih banyak CPU karena memiliki lebih banyak CPU akan meningkatkan kuota instance VM. Kuota berlaku untuk VM yang berjalan dan tidak berjalan, dan untuk instance normal dan preemptible instance.

  1. Di konsol Google Cloud, buka halaman Kuota.

    Buka Quotas

  2. Klik Filter tabel, lalu pilih Layanan.

  3. Pilih Compute Engine API.

  4. Pilih Quota: VM instances.

  5. Untuk melihat daftar kuota instance VM berdasarkan region, klik Semua Kuota. Kuota region Anda dicantumkan dari penggunaan tertinggi hingga terendah.

  6. Klik kotak centang region yang kuotanya ingin Anda ubah.

  7. Klik Edit Kuota.

  8. Isi formulir.

  9. Klik Kirim permintaan.

Grup instance

Untuk menggunakan grup instance, Anda harus memiliki kuota yang tersedia untuk semua resource yang digunakan grup (misalnya, kuota CPU) dan kuota yang tersedia untuk resource grup itu sendiri. Bergantung pada jenis grup yang Anda buat, kuota penggunaan resource grup berikut berlaku:

Jenis layanan Kuota layanan
Grup instance terkelola regional (multi-zona) Regional instance group managers
Grup instance terkelola zona (zona tunggal) Keduanya dari:
  • Instance group managers
  • Instance groups
Grup instance tidak terkelola (zona tunggal) Instance groups
Autoscaler regional (multi-zona) Regional autoscalers
Autoscaler zona (zona tunggal) Autoscalers

Kuota disk

Kuota Persistent Disk, Hyperdisk, dan SSD Lokal berikut berlaku per region:

  • Local SSD per machine family (GB). Kuota ini adalah total ukuran gabungan dari disk SSD Lokal yang dapat Anda pasang ke VM di region berdasarkan jenis mesin setiap VM. SSD lokal adalah ephemeral disk cepat yang harus digunakan untuk tugas scratch, cache lokal, atau pemrosesan dengan fault-tolerance yang tinggi, karena disk ini tidak dimaksudkan untuk mampu bertahan melewati reboot instance VM.

    Disk SSD lokal dijual dengan kelipatan 375 GiB atau 3 TiB, bergantung pada jenis mesin. Ada juga jumlah maksimum disk SSD Lokal yang dapat dipasang ke satu VM, bergantung pada jenis mesin. Jumlah maksimum disk SSD Lokal, dan ukuran setiap disk SSD Lokal menciptakan batas jumlah total kapasitas disk SSD Lokal yang dapat Anda alokasikan untuk VM. Di gcloud CLI dan API, batas ini disebut sebagai kuota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    Untuk VM ultra A3 dan A2, Anda tidak perlu meminta kuota ini karena SSD Lokal akan otomatis ditambahkan ke VM tersebut. Namun, Anda harus meminta LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY untuk VM yang dioptimalkan akselerator lainnya.

  • Persistent disk standard (GB). Kuota ini adalah ukuran total Persistent Disk Standar yang dapat dibuat di suatu region. Seperti yang dijelaskan dalam Mengoptimalkan performa Persistent Disk, Persistent Disk Standar menawarkan IOPS dan throughput yang lebih rendah daripada disk Persisten SSD atau disk SSD Lokal. Ini hemat biaya jika digunakan sebagai disk besar yang tahan lama untuk penyimpanan, sebagai boot disk, dan untuk rangkaian proses penulisan seperti log. Persistent Disk Standar tahan lama dan tersedia tanpa batas untuk dipasang ke VM dalam zona yang sama. Di gcloud CLI dan API, kuota ini disebut sebagai DISKS_TOTAL_GB. Kuota ini juga berlaku untuk Persistent Disk Standar Regional, tetapi Persistent Disk Regional menggunakan dua kali jumlah kuota per GiB karena replikasi di dua zona dalam suatu region.

  • Persistent disk SSD (GB). Kuota ini adalah total ukuran gabungan dari volume Persistent Disk yang didukung SSD yang dapat dibuat di suatu region. Persistent Disk yang didukung SSD, seperti yang dijelaskan dalam Performa block storage, menawarkan IOPS dan throughput yang lebih tinggi daripada Persistent Disk Standar. Persistent Disk yang didukung SSD tersedia tanpa batas untuk dipasang ke VM dalam zona yang sama. Di gcloud CLI dan API, kuota ini disebut sebagai SSD_TOTAL_GB. Kuota ini terpisah dari kuota untuk disk SSD Lokal. Kuota ini berlaku untuk jenis disk berikut:

    • Persistent Disk SSD Zona dan Regional
    • Persistent Disk Seimbang Zona dan Regional

    Persistent Disk Regional menggunakan dua kali jumlah kuota per GiB karena replikasi di dua zona dalam suatu region.

Kuota penyimpanan gabungan

Kumpulan Penyimpanan Hyperdisk memiliki kuota berikut, yang diukur dalam GB (atau 1.000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): Jumlah total kapasitas disk yang dapat Anda reservasi di Kumpulan Penyimpanan Seimbang Hyperdisk dengan penyediaan kapasitas Lanjutan. Di gcloud CLI dan API, kuota ini disebut sebagai (HDB_STORAGE_POOL_TOTAL_ADVANCED_CAPACITY).

  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): Jumlah total kapasitas disk yang dapat Anda reservasi di Tampungan Dana Penyimpanan Hyperdisk dengan Penyediaan kapasitas lanjutan. Di gcloud CLI dan API, kuota ini disebut sebagai (HDT_STORAGE_POOL_TOTAL_ADVANCED_CAPACITY).

Batas kuota CPU

Kuota CPU adalah jumlah total CPU virtual di semua instance VM di suatu region. Kuota CPU berlaku untuk VM yang berjalan dan pemesanan VM. Baik VM yang telah ditetapkan sebelumnya maupun preemptible VM akan memakai kuota ini.

Untuk membantu melindungi sistem Compute Engine dan pengguna lainnya, beberapa akun dan project baru juga memiliki kuota CPUs (All Regions) global. Kuota tersebut berlaku untuk semua region dan diukur sebagai jumlah semua vCPU Anda di semua region.

Misalnya, jika Anda memiliki 48 vCPU yang tersisa di satu region seperti us-central1, tetapi hanya tersisa 32 vCPU untuk kuota CPUs (All Regions), Anda hanya dapat meluncurkan 32 vCPU di region us-central1, meskipun ada sisa kuota di region tersebut. Ini karena Anda mencapai kuota CPU (All Regions) dan perlu menghapus instance yang sudah ada sebelum dapat meluncurkan instance baru.

Jenis mesin E2 dan N1 menggunakan kumpulan kuota CPU yang sama. Kecuali jika dinyatakan lain, semua jenis mesin lainnya memiliki kumpulan kuota CPU terpisah yang unik.

Jika menggunakan diskon abonemen untuk VM, Anda harus memiliki kuota diskon abonemen sebelum membeli kontrak diskon abonemen.

Machine type Kumpulan kuota Nama kuota CPU Nama kuota CPU yang dikomitmenkan
N1 kumpulan bersama CPUS Committed_CPUS
E2 kumpulan bersama CPUS Committed_CPUS
N2 kumpulan terpisah N2_CPUS Committed_N2_CPUS
N4 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D kumpulan terpisah N2D_CPUS Committed_N2D_CPUS
T2D kumpulan terpisah T2D_CPUS Committed_T2D_CPUS
T2A kumpulan terpisah T2A_CPUS Tidak tersedia (T/A) untuk T2A
Z3 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 kumpulan terpisah M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 kumpulan terpisah M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 kumpulan terpisah M3_CPUS Committed_M3_CPUS
H3 kumpulan terpisah CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 kumpulan terpisah C2_CPUS Committed_C2_CPUS
C2D kumpulan terpisah C2D_CPUS Committed_C2D_CPUS
C3 kumpulan terpisah C3_CPUS Committed_C3_CPUS
C3D kumpulan terpisah CPUS_PER_VM_FAMILY Committed_C3D_CPUS
A2* kumpulan terpisah A2_CPUS Committed_A2_CPUS
A3 Tidak berlaku (T/A) untuk A3 Tidak berlaku (T/A) untuk A3 Tidak berlaku (T/A) untuk A3
G2 Tidak berlaku (T/A) untuk G2 Tidak berlaku (T/A) untuk G2 Tidak berlaku (T/A) untuk G2
Preemptible VM kumpulan bersama PREEMPTIBLE_CPUS Tidak tersedia (T/A) untuk preemptible VM

*Untuk VM A2, Anda tidak perlu meminta kuota CPU. Jika Anda memiliki kuota GPU NVIDIA A100 yang diperlukan, hanya itu yang diperlukan untuk membuat VM ini.

Untuk VM A3 dan G2, kuota CPU tidak berlaku. Jika Anda memiliki kuota GPU NVIDIA H100 dan L4 yang diperlukan, itulah yang diperlukan untuk membuat VM ini.

Kuota GPU

Sama seperti kuota CPU virtual, kuota GPU mengacu pada jumlah total GPU virtual di semua instance VM di suatu region. Kuota GPU berlaku untuk VM yang berjalan dan pemesanan VM. Baik VM yang telah ditetapkan sebelumnya maupun preemptible VM akan memakai kuota ini.

Buka halaman Kuota untuk memastikan bahwa Anda memiliki cukup GPU yang tersedia dalam project, dan untuk meminta peningkatan kuota. Selain itu, akun dan project baru memiliki kuota GPU global yang berlaku untuk semua region.

Saat meminta kuota GPU, Anda harus meminta kuota untuk model GPU yang ingin Anda buat di setiap region, dan kuota global tambahan (GPUs (all regions)) untuk jumlah total GPU dari semua jenis di semua region. Minta kuota GPU yang dapat dihentikan untuk menggunakan resource tersebut.

NVIDIA Nama kuota GPU Nama kuota GPU yang dikomitmenkan Workstation virtual Preemptible GPU Workstation virtual preemptible GPU
H100 80GB GPUS_PER_GPU_FAMILY COMMITTED_NVIDIA_H100_GPUS T/A PREEMPTIBLE_NVIDIA_H100_GPUS T/A
A100 40GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS T/A PREEMPTIBLE_NVIDIA_A100_GPUS T/A
A100 80GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS T/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS T/A
L4 NVIDIA_L4_GPUS COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS T/A PREEMPTIBLE_NVIDIA_V100_GPUS T/A
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS T/A PREEMPTIBLE_NVIDIA_K80_GPUS T/A

Kuota alokasi untuk preemptible resource

Untuk menggunakan preemptible CPU atau GPU yang dipasang ke instance VM yang dapat dihentikan, atau untuk menggunakan SSD lokal yang dipasang ke instance preemptible VM, Anda harus memiliki kuota yang tersedia dalam project untuk resource masing-masing.

Anda dapat meminta kuota khusus yang dapat dihentikan untuk Preemptible CPUs, Preemptible GPUs, atau Preemptible Local SSDs (GB). Namun, jika project Anda tidak memiliki kuota yang dapat dihentikan, dan Anda belum pernah meminta kuota yang dapat dihentikan, Anda dapat menggunakan kuota standar untuk meluncurkan resource yang dapat dihentikan.

Setelah Compute Engine memberikan kuota preemptible di suatu region, semua preemptible instance akan otomatis mengurangi kuota preemptible. Saat kuota ini habis, Anda harus meminta kuota preemptible untuk resource tersebut.

Alamat IP eksternal

Anda harus memiliki alamat IP eksternal yang cukup untuk setiap VM yang harus dapat dijangkau langsung dari internet publik. Kuota IP regional digunakan untuk menetapkan alamat IPv4 ke VM di region tersebut. Kuota IP global digunakan untuk menetapkan alamat IPv4 ke resource global networking seperti load balancer. Google Cloud menawarkan berbagai jenis alamat IP, sesuai kebutuhan Anda. Untuk mengetahui informasi tentang biaya, lihat Harga alamat IP eksternal. Untuk mengetahui informasi mengenai spesifikasi kuota, lihat Kuota dan batas.

  • Alamat IP eksternal yang sedang digunakan. Mencakup alamat IP sementara dan statis yang digunakan oleh resource.

  • Alamat IP Eksternal Statis: Alamat IP eksternal yang dicadangkan untuk resource Anda yang akan tetap ada setelah mesin dimulai ulang. Anda dapat mendaftarkan alamat ini dengan layanan penyedia domain dan DNS untuk memberikan alamat yang mudah digunakan. Misalnya, www.example-site.com.

  • Alamat IP Internal Statis: Alamat IP internal statis memungkinkan Anda memesan alamat IP internal dari rentang IP internal yang dikonfigurasi di subnet. Anda dapat menetapkan alamat internal yang dipesan tersebut ke resource sesuai kebutuhan.

Peluncuran kuota

Terkadang, Google Cloud mengubah kuota default untuk resource dan API. Perubahan ini dilakukan secara bertahap. Selama peluncuran kuota default baru, kuota maksimum yang muncul di konsol Google Cloud mungkin tidak mencerminkan kuota maksimum sebenarnya yang tersedia untuk Anda.

Misalnya, jika Google Cloud mengubah kuota maksimum default untuk aturan firewall dari 200 menjadi 300, dan Anda menggunakan konsol Google Cloud untuk melihat kuota, Anda mungkin akan melihat kuota baru sebesar 300, meskipun kuota sebenarnya adalah 200 hingga peluncuran selesai.

Untuk mengetahui informasi tentang peluncuran kuota yang sedang berlangsung, lihat masalah umum. Jika tidak ada masalah yang dijelaskan, tidak ada peluncuran kuota yang sedang berlangsung.

Jika peluncuran kuota sedang berlangsung dan Anda ingin mengonfirmasi kuota maksimum sebenarnya yang tersedia untuk Anda, gunakan Google Cloud CLI untuk memeriksa kuota. Jika Anda memerlukan kuota lebih banyak daripada yang dapat diakses, kirimkan permintaan penambahan kuota.

Langkah selanjutnya