Nesta página, listamos páginas de solução de problemas comuns que você pode encontrar ao usar o Google Kubernetes Engine (GKE). Esta página é destinada a administradores e arquitetos, especialistas em segurança, especialistas Rede ou especialistas em armazenamento que resolvem problemas de configurações do GKE. Para saber mais sobre as funções do GKE, consulte Tarefas e funções de usuário comuns do GKE.
Se você não tem experiência em solução de problemas no GKE ou quer uma visão geral de alto nível das ferramentas e técnicas fundamentais, comece com Introdução à solução de problemas.
Para diagnosticar e resolver problemas encontrados em várias etapas do trabalho com sua infraestrutura do GKE, consulte as seções a seguir:
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo criação de clusters, exclusão de namespaces, escalonamento e problemas de carga de trabalho.
Resolver problemas da ferramenta de linha de comando kubectl no GKE, incluindo problemas de autenticação e autorização. Esta página também inclui dicas sobre como resolver problemas do proxy Konnectivity para verificar se ele está fazendo com que os comandos kubectl logs, attach, exec ou port-forward parem de responder.
Resolver problemas em pools de nós padrão do GKE, incluindo problemas com a criação de pool de nós, provisionamento de melhor esforço, metadados de instância corrompidos e migração de cargas de trabalho para novos pools de nós.
Resolver problemas que ocorrem ao adicionar nós ao cluster GKE Standard, como falhas no registro de nós e pré-requisitos ausentes para o registro bem-sucedido de nós.
Diagnosticar e resolver motivos comuns para o cluster não remover nós subutilizados. Saiba como verificar problemas como PodDisruptionBudgets restritivos, pods com armazenamento local ou anotações específicas (por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false") que impedem a remoção de nós.
Saiba por que o escalonador automático de cluster não está adicionando novos nós para atender à demanda. Verifique se há pods não programáveis, se você não atingiu os limites de tamanho do cluster ou do pool de nós e identifique possíveis problemas de cota de recursos ou de disponibilidade regional de VMs.
Resolva problemas com o escalonador automático horizontal de pods que não está escalonando as réplicas de pod do seu aplicativo. Resolva problemas comuns, como objetos HorizontalPodAutoscaler mal configurados ou problemas com o pipeline de métricas.
Resolva problemas de autenticação no GKE, incluindo problemas com RBAC, federação de identidade da carga de trabalho para GKE e o servidor de metadados do GKE.
Se a autoridade certificadora (CA) raiz do cluster expirar em breve, saiba como fazer uma rotação de credenciais para evitar que as operações normais do cluster sejam interrompidas.
Resolva problemas de extração de imagens. Saiba o que causa status como ImagePullBackOff e ErrImagePull e como resolver esses status corrigindo problemas comuns, como autenticação e conectividade de rede.
Solucione problemas de eventos CrashLoopBackOff no GKE. Diagnosticar problemas como esgotamento de recursos, configurações incorretas de apps e falhas na sondagem de atividade.
Resolver problemas com eventos de memória insuficiente (OOM) do Kubernetes. Identificar causas, distinguir tipos de eventos e aplicar soluções eficazes para encerramentos por falta de memória (OOM) no nível do contêiner e do nó.
Resolva problemas de upgrade de cluster e nó do GKE, incluindo upgrades longos ou incompletos, upgrades automáticos inesperados, falhas e problemas pós-upgrade.
Para resolver problemas com namespaces travados no estado Terminating, identifique e remova os componentes não íntegros que estão impedindo a exclusão.
Solucione alguns dos erros 400, 401, 403 e 404 que você pode encontrar ao usar o GKE. Esta página também inclui informações sobre como resolver erros de permissões de edição ausentes na conta.
Identifique e resolva problemas conhecidos que possam afetar seu uso do GKE.
A seguir
Se você não encontrar uma solução para seu problema na documentação, consulte Receber suporte para mais ajuda, incluindo conselhos sobre os seguintes tópicos:
Receber suporte da comunidade fazendo perguntas no StackOverflow e usando a tag google-kubernetes-engine para pesquisar problemas semelhantes. Você também pode participar do canal do Slack #kubernetes-engine para receber mais suporte da comunidade.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-20 UTC."],[],[]]