Identificar onde ocorre a latência

Esta página descreve como resolver problemas dos componentes do Spanner para encontrar a origem da latência. Para saber mais sobre possíveis pontos de latência em um solicitação do Spanner, consulte Pontos de latência em uma solicitação do Spanner.

  1. No aplicativo cliente que afeta seu serviço, confirme se há um aumento de latência do tempo de ida e volta do cliente. Verifique as seguintes dimensões das métricas do lado do cliente.

    • Nome do aplicativo cliente
    • Localidade do cliente (por exemplo, zonas de VM do Compute Engine) e host (ou seja, nomes de VM)
    • Método da API Spanner
    • Status da API Spanner

    Agrupe por essas dimensões para saber se o problema está limitado a um cliente, status ou método específico. Para cargas de trabalho birregionais ou multirregionais, verifique se o problema está limitado a um cliente ou região do Spanner específico.

  2. Verificar a integridade do aplicativo cliente, principalmente da área de computação infraestrutura no lado do cliente (por exemplo, VM, CPU ou memória utilização, conexões, descritores de arquivo e assim por diante).

  3. Verifique a latência nos componentes do Spanner:

    a. Verificar a latência de ida e volta do cliente com o OpenTelemetry ou com o OpenCensus.

    b. Verifique a latência do Google Front End (GFE) com o OpenTelemetry ou com o OpenCensus.

    c. Verifique a latência da solicitação da API Spanner com o OpenTelemetry ou com o OpenCensus.

    Se você tiver alta latência de ida e volta do cliente, mas baixa latência do GFE e uma baixa latência latência de solicitação da API Spanner, o código do aplicativo pode têm um problema. Também pode indicar um problema de rede entre o cliente e o GFE regional. Se o aplicativo tiver um problema de desempenho que faça com que alguns caminhos de código sejam lentos, a latência de ida e volta do cliente para cada API pode aumentar. Também pode haver um problema no sistema de computação infraestrutura que não foi detectada na etapa anterior.

  4. Verifique as seguintes dimensões para Métricas do Spanner:

    • Nome do banco de dados do Spanner
    • Método da API Spanner
    • Status da API Spanner

    Agrupe por essas dimensões para ver se o problema é limitado a uma determinada banco de dados, status ou método. Para cargas de trabalho birregionais ou multirregionais, verifique se o problema está limitado a uma região específica.

    Se você tiver uma alta latência do GFE, mas uma baixa solicitação da API Spanner latência, pode ter uma das seguintes causas:

    • Acesso a um banco de dados de outra região. Essa ação pode aumentar a latência do GFE e diminuir a latência da solicitação da API Spanner. Por exemplo: tráfego de um cliente na região us-east1 que tem uma instância na A região us-central1 pode ter uma latência alta do GFE, mas uma Latência de solicitação da API Spanner.

    • Há um problema na camada GFE. Verifique no Painel de status do Google Cloud se há algum problema de rede na sua região. Se não houver nenhum problema, abra um caso de suporte e inclua essas informações para que os engenheiros de suporte possam ajudar na solução de problemas do GFE.

  5. Confira a utilização da CPU da instância. Se a utilização da CPU da instância estiver acima do nível recomendado, adicione manualmente mais nós ou configure o escalonamento automático. Para mais informações, consulte Visão geral do escalonamento automático.

  6. Observe e resolva possíveis pontos de acesso ou padrões de acesso desequilibrados usando o Key Visualizer e tente reverter as mudanças no código do aplicativo que estão fortemente relacionadas ao período do problema.

  7. Verifique se há alterações no padrão de tráfego.

  8. Verifique os insights de consulta e os insights de transação para saber se há gargalos de desempenho de consulta ou transação. Na maioria dos casos, é necessário seguir as práticas recomendadas do Spanner para otimizar consultas ou transações.

  9. Use os procedimentos em Consultas ativas mais antigas para detectar consultas de despesa que possam causar um gargalo de desempenho e para cancelar as consultas quando necessário.

  10. Use os procedimentos nas seções de solução de problemas nos seguintes tópicos para resolver o problema usando a introspecção do Spanner ferramentas:

A seguir