GAE: [Parte 1] Como funciona o auto scaling
Dentro do App Engine, existem 3 tipos de configuração de "scaling" que podem ser feitas. Os "requests" que a sua aplicação está recebendo serão direcionados para a instância em execução ou para uma nova instância dependendo da configuração de "scalling" que foi realizada para a mesma.
Os tipos de scalling são:
Manual
- um número fixo de instâncias é definido antes do request chegar.
- Permite que código "pesado" de start possa ser executado.
Basic
- Nenhuma instância é criada, até que chegue o primeiro request
- Você deve limitar o número máximo de instâncias (max_instances)
- Para o downscaling, ou seja, para diminuir o número de instâncias disponíveis, existe o parâmetro idle_timeout (default = 5 min). Se a instância ficar sem utilização por este período, ela será automaticamente desligada.
Automatic
- Instâncias criadas e destruídas com base na demanda
- Gerenciado automaticamente por algoritmos da plataforma do Google. Porém, você deve configurar alguns parâmetros como o número máximo e mínimo de instâncias, latência e concorrência.
No próximo post colocarei os detalhes de configuração de cada uma delas.
Comentários
Postar um comentário