Cette page explique comment identifier les clusters Google Kubernetes Engine (GKE) sous-provisionnés et sur-provisionnés. GKE fournit des insights et des recommandations pour les scénarios d'optimisation des coûts, tels que les clusters surprovisionnés et les clusters inactifs, et les scénarios d'amélioration de la fiabilité, tels que les clusters sous-provisionnés. GKE fournit des recommandations correspondantes pour faire évoluer, réduire ou supprimer les clusters. Pour les clusters inactifs, consultez Identifier les clusters GKE inactifs.
Après avoir vérifié que les clusters identifiés bénéficieraient de la recommandation d'ajustement à la hausse ou à la baisse, vous pouvez effectuer la modification recommandée pour réduire les coûts ou augmenter la fiabilité de votre cluster. Si possible, la recommandation inclut les économies ou les coûts mensuels projetés. Pour en savoir plus, consultez Comprendre les estimations de coûts ou d'économies.
GKE ne fournit pas ces insights pour les clusters Autopilot, qui entraînent des coûts opérationnels minimaux, car vous ne payez que pour les ressources demandées par vos charges de travail. Pour en savoir plus, consultez la section Tarifs du mode Autopilot.
GKE surveille vos clusters et fournit des conseils pour optimiser votre utilisation via Active Assist, un service qui fournit des outils de recommandation qui génèrent des insights et des recommandations pour l'utilisation des ressources sur Google Cloud. Pour en savoir plus sur la gestion des insights et des recommandations, consultez la section Optimiser l'utilisation de GKE avec des insights et des recommandations.
Obtenir des insights et des recommandations pour les clusters sous-provisionnés et sur-provisionnés
GKE affiche ces insights et recommandations dans les emplacements suivants de la console Google Cloud :
- Page Clusters Kubernetes, aux emplacements suivants :
- Dans la liste Clusters Kubernetes, dans la colonne Notifications pour les clusters concernés
- Bannières de notification sur la page Clusters pour un cluster spécifique
- Hub FinOps
Les recommandations portent les titres suivants sur la page Clusters Kubernetes:
- Clusters surprovisionnés: "Réduire les ressources du cluster pour réduire les coûts"
- Clusters sous-provisionnés: "Augmentez les ressources du cluster pour améliorer sa fiabilité"
Vous pouvez également recevoir ces insights et recommandations via la Google Cloud CLI ou l'API Recommender, à l'aide des sous-types CLUSTER_UNDERPROVISIONED
et CLUSTER_OVERPROVISIONED
.
Suivez les instructions pour afficher des insights et des recommandations.
Après avoir identifié les clusters sous-provisionnés ou surprovisionnés, consultez les considérations à prendre en compte lors du redimensionnement des clusters.
Comment GKE identifie-t-il les clusters sous-provisionnés et surprovisionnés ?
Le tableau suivant décrit les signaux utilisés par GKE pour identifier les clusters sous-provisionnés et surprovisionnés pouvant être mis à l'échelle, ainsi que le seuil de chaque signal. En outre, ce tableau indique l'action que nous vous recommandons de prendre dans ce scénario.
Sous-type | Signal | Période d'observation | Détails | Recommandation |
---|---|---|---|---|
CLUSTER_UNDERPROVISIONED | L'utilisation du processeur ou de la mémoire est élevée | 30 derniers jours | Un cluster GKE est sous-provisionné lorsque l'utilisation moyenne du processeur et de la mémoire est supérieure à 80% chaque heure au cours des 30 derniers jours. | Évoluer votre cluster pour améliorer sa fiabilité |
CLUSTER_OVERPROVISIONED | L'utilisation du processeur et de la mémoire est faible | 30 derniers jours | Un cluster GKE est surprovisionné lorsque l'utilisation moyenne du processeur et de la mémoire est comprise entre 7% et 20% chaque heure au cours des 30 derniers jours. | Réduire la taille de votre cluster pour réduire les coûts |
GKE n'envoie pas de recommandations pour les clusters créés il y a moins de 30 jours.
Comprendre les estimations de coûts ou d'économies
Si possible, la recommandation de GKE inclut une estimation qui projette le coût ou les économies mensuelles si vous redimensionnez le cluster. Cette estimation est basée sur les coûts du cluster pour les 30 derniers jours.
Les coûts ou économies estimés sont des projections basées sur les dépenses précédentes. Elles ne garantissent pas les coûts ou économies futurs.
Pour afficher ces estimations, assurez-vous de disposer de l'autorisation billing.accounts.getSpendingInformation
requise pour obtenir des informations sur les dépenses. Pour en savoir plus, consultez la section Accès à Cloud Billing.
Pour en savoir plus sur le coût de tous vos clusters GKE, y compris une répartition plus détaillée en fonction des espaces de noms et des charges de travail, consultez Obtenir des insights clés sur vos dépenses pour l'allocation des ressources GKE et les coûts des clusters.
Pour en savoir plus sur les coûts d'exécution d'un cluster GKE, consultez la page Tarifs de GKE.
Éléments à prendre en compte lors du dimensionnement des clusters
Avant de suivre une recommandation de scaling up ou down d'un cluster, tenez compte des points suivants:
- Examinez l'utilisation des ressources des applications exécutées sur votre cluster pour voir leurs performances et s'ils utilisent plus ou moins de CPU et de mémoire que prévu. Pour obtenir des instructions, consultez la section Analyser les requêtes de ressources.
- Les charges de travail de traitement par lot peuvent maintenir intentionnellement une utilisation élevée des ressources du cluster pour plus d'efficacité. Si les ressources de cluster allouées sont suffisantes pour les tâches par lot exécutées sur le cluster, vous n'avez pas besoin d'augmenter la taille du cluster très utilisé, qui a été identifié comme sous-provisionné.
Mettre en œuvre la recommandation concernant l'ajustement de la taille d'un cluster
Consultez les informations suivantes pour comprendre comment ajuster la taille d'un cluster afin de mieux correspondre à votre utilisation des ressources.
Adapter la taille d'un cluster sous-provisionné
Pour mettre en œuvre la recommandation visant à réduire le risque de fiabilité en ajustant la taille d'un cluster sous-provisionné, augmentez les ressources du cluster. Pour ce faire, vous pouvez effectuer l'une des actions suivantes:
- Activez l'autoscaler de cluster et le provisionnement automatique des nœuds, ou ajustez les paramètres pour permettre une augmentation plus importante.
- Mettez à l'échelle horizontale votre cluster en augmentant le nombre de nœuds. Suivez les instructions pour effectuer un scaling horizontal en modifiant le nombre de nœuds.
- Choisissez un type de machine plus grand pour vos pools de nœuds. Suivez les instructions pour effectuer un scaling vertical en modifiant les attributs de machine des nœuds.
- Surveillez et examinez l'utilisation des ressources de processeur et de mémoire des applications exécutées sur votre cluster. Vérifiez si vous pouvez réduire la taille des applications. Pour obtenir des instructions sur la surveillance de l'utilisation des ressources, consultez Analyser les requêtes de ressources.
En implémentant cette recommandation, vous vous assurez que votre cluster reste fiable, car il dispose de la quantité de ressources appropriée pour ses applications.
Redimensionner un cluster surprovisionné
Pour mettre en œuvre la recommandation visant à réduire les coûts en ajustant la taille d'un cluster surprovisionné, réduisez les ressources du cluster. Ajustez les allocations de CPU et de mémoire du cluster en fonction des besoins de votre charge de travail. Pour ce faire, vous pouvez effectuer l'une des actions suivantes:
- Ajustez l'autoscaler de cluster et le provisionnement automatique des nœuds pour réduire plus radicalement les ressources sous-utilisées.
- Réduisez horizontalement votre cluster en diminuant le nombre de nœuds. Suivez les instructions pour effectuer un scaling horizontal en modifiant le nombre de nœuds.
- Choisissez un type de machine plus petit pour vos pools de nœuds. Suivez les instructions pour effectuer un scaling vertical en modifiant les attributs de machine des nœuds.
- Surveillez et examinez l'utilisation des ressources de processeur et de mémoire des applications exécutées sur votre cluster. Vérifiez si vous pouvez faire évoluer les applications. Pour savoir comment surveiller l'utilisation des ressources, consultez Analyser les requêtes de ressources.
En implémentant cette recommandation, vous vous assurez de ne pas utiliser plus de ressources que nécessaire pour exécuter les applications de votre cluster.
Étape suivante
- Afficher les métriques d'optimisation liées aux coûts
- Réduire les coûts en procédant au scaling à la baisse des clusters GKE pendant les heures creuses
- Optimisez votre utilisation de GKE en exploitant les insights et les recommandations.
- Bonnes pratiques pour l'exécution d'applications Kubernetes à coût maîtrisé sur GKE
- 5 fonctionnalités GKE pour vous aider à optimiser vos clusters