GAE: [Parte 1] Como funciona o auto scaling

Dentro do App Engine, existem 3 tipos de configuração de "scaling" que podem ser feitas. Os "requests" que a sua aplicação está recebendo serão direcionados para a instância em execução ou para uma nova instância dependendo da configuração de "scalling" que foi realizada para a mesma.
Os tipos de scalling são:
Manual
  • um número fixo de instâncias é definido antes do request chegar.
  • Permite que código "pesado" de start possa ser executado.
Basic
  • Nenhuma instância é criada,  até que chegue o primeiro request
  • Você deve limitar o número máximo de instâncias (max_instances)
  • Para o downscaling, ou seja, para diminuir o número de instâncias disponíveis, existe o parâmetro idle_timeout (default = 5 min). Se a instância ficar sem utilização por este período, ela será automaticamente desligada.
Automatic
  • Instâncias criadas e destruídas com base na demanda
  • Gerenciado automaticamente por algoritmos da plataforma do Google. Porém, você deve configurar alguns parâmetros como o número máximo e mínimo de instâncias, latência e concorrência.
No próximo post colocarei os detalhes de configuração de cada uma delas.
 

Comentários

Postagens mais visitadas deste blog

Entendendo o conceito de Error Budget: como o Google lida com o downtime

Analista de sistemas – z/VM

Sqlite e o Windows Phone 8.1 Silverlight