GAE: Como fazer o troubleshooting?

O que fazer se algo parar de funcionar ?

Em um sistema tradicional "on premisse", normalmente faríamos o seguinte:

  1. "Logamos" no servidor
  2. Começamos a investigar o sistema operacional, a aplicação e os logs.
E o que fazer no caso de um app rodando na nuvem, cuja instância pode estar sendo executada em qualquer servidor ?

No caso do GAE, da plataforma do Google, a recomendação é a seguinte:

Verifique o status do App Engine

Antes de se "descabelar" e começar a procurar o problema na sua aplicação, verifique o status da plataforma App Engine, através da seguinte página:

https://status.cloud.google.com/


Você pode assinar o RSS Feed no rodapé da página, para receber os status de forma automática.


Verifique o Google Admin Console

http://console.developers.google.com


Na página inicial você também pode verificar o status geral de todos os serviços da plataforma. Além disso, verifique o status de suas instâncias do GAE, suas versões, tráfico e quota.

Páginas importantes do Admin Console


Para monitoramento diário use:

  • dashboard (página inicial)
  • página de instâncias (GAE--> "Instâncias")
  • página de quotas (GAE -->"Detalhes das Quotas")
  • páginas de log (Monitoramento-->"Registros")
Para configuração e deployment do app use:

  • página de configurações do app
  • página de versões

Verifique os logs


Na página de logs, podemos ver os logs gerados pelos "requests" e também logs "customizados", ou seja, gerados manualmente dentro do código. É possível filtrar pelos diferentes níveis de log (crítico, erro, etc):





Comentários

Postagens mais visitadas deste blog

Entendendo o conceito de Error Budget: como o Google lida com o downtime

Analista de sistemas – z/VM

Sqlite e o Windows Phone 8.1 Silverlight