Passer

Turbonomic: quelle valeur ajoutée apporte la solution d’optimisation opérationnelle du cloud ?

Avec le développement des hébergements cloud, aussi bien public que privé, l’infrastructure peut rapidement croître et atteindre une taille critique, rendant la gestion et l’optimisation manuelle complexe et où la maintenance devient souvent corrective plutôt que proactive. A travers cet article, nous verrons comment déployer la solution Turbonomic au sein d’un programme de transformation cloud. Prenons l’exemple d’un projet pilote réalisé récemment dans une entreprise cliente. Le parc comportait plus de 6 000 VM et avait une croissance autour de  ~100 VM par mois. En prenant ce cas concret, nous suivrons la chronologie du déploiement de Turbonomic et exposerons les avantages opérationnels que cela représente.

turbonomic

Pourquoi déployer Turbonomic ?

Les bénéfices attendus du déploiement de cet outil d’optimisation d’infrastructure Cloud étaient alors axés sur : 

  • Optimisation des ressources disponibles: à travers le rééquilibrage d’infrastructures par déplacements de VMs, d’un noeud de cluster à un autre ou d’un cluster à l’autre et le redimensionnement des VMs sur la base de l’utilisation réelle des ressources.
  • Lissage des investissements: en maximisant le potentiel d’hébergement de l’infrastructure avant tout nouvel investissement.
  • Amélioration de la performance: à travers l’adaptation du placement au profit de consommation de l’application.
  • Réduction des risques d’incidents: à travers l’application automatique des règles de stabilité (par exemple: seuil maximum d’utilisation de la RAM à 95%)
  • Réduction de la charge de travail des équipes: en automatisant les tâches manuelles d’administration de l’infrastructure.

Le choix de la solution Turbonomic s’est fait après l’échec de l’intégration de l’outil Microfocus Cloud Optimizer et l’analyse de plusieurs outils du marché. Turbonomic s’est imposé comme l’outil répondant au mieux aux besoins du client et offrant un ensemble suffisant d’API pour assurer une intégration efficace à son écosystème.

Les différentes phases du déploiement de Turbonomic 

Le déploiement de Turbonomic comportait différents objectifs, dans un premier temps, il visait à réaliser des économies en investissement d’infrastructure (achat de cluster) à travers des opérations de déplacement de VMs intra et inter cluster sur le périmètre de l’infrastructure du programme (une seule entité du groupe). Par ailleurs, ce projet pilote permettait d’améliorer et de fiabiliser le capacity planning grâce au module “Plan” de Turbonomic ainsi que de d’augmenter l’efficacité opérationnelle des équipes de production via plus de maintenance proactive que corrective.

Le projet s’est déroulé sur 5 mois selon la timeline suivante:

  • Mois 1: formation de l’équipe projet à l’outil Turbonomic, déploiement de la solution sur la plateforme de pré-production et réalisation des tests de recette.
  • Mois 2: déploiement de Turbonomic sur la plateforme de production, mise en place des règles d’exploitation (tags des environnements des VMs, des types de clusters, limitation de 58 Vm / noeud, groupes utilisateurs, …) et réalisation des premiers tests de déplacement manuel sur des Vms de non-production.
  • Mois 3: généralisation des déplacements intra-cluster en mode manuel sur l’ensemble de l’infrastructure dans un premier temps puis passage en mode automatique suivant les préconisations des consultants Turbonomic et permettant la maximisation des gains. En raison des contraintes de production de l’entreprise cliente, il a été décidé de réaliser les actions automatiques selon la planification suivante:
    • en 24h/24h pour les environnements de développement et d’intégration, 
    • du lundi au vendredi en soirée pour les environnements de pré-production,
    • le week-end pour les environnements de production.
  • Mois 4: activation des déplacements intra-cluster pour une meilleure optimisation de l’utilisation de l’infrastructure existante. En raison de la réticence des équipes de production, les déplacements ont été réalisés dans un premier temps de façon manuelle pendant le weekend. Cependant après quelques exécutions, les équipes ont été rassurées et ont validé le passage en automatique sur les mêmes plages de maintenance définies pour les déplacements intra cluster. En effet, pendant toutes les phases d’exécution, aucun incident de production n’a été provoqué par Turbonomic sur plus de 500 déplacements réalisés.

A ce stade du projet, les équipes de production, réticentes au démarrage, avaient adhéré au projet ayant pu constater l’apport opérationnel de l’outil. En effet, le dashboard Turbonomic permet de piloter le parc en tant réel en affichant les noeuds, clusters ou VMs à risque et en donnant des recommandations sur les investissements à venir. L’outil permet aussi de prévenir ces risques, sans intervention humaine, en réalisant de façon automatique jusqu’à une centaine de déplacements par période de maintenance.

dashboard turbonomic
Source: Site officiel Turbonomic

 

Le dernier mois du projet a été consacré à la présentation des gains économiques, autour de 10 clusters sur 9 mois, au comité du pilotage en vue de la généralisation de la solution au groupe. Lors de ce pilote, nous avons mis en oeuvre les fonctionnalités suivantes de Turbonomic:

  • Optimisation de l’infrastructure: déplacements de VM intra et inter cluster.
  • Respect de la conformité: déplacements de VM tout en respectant les contraintes opérationnelles (e.g.: limitation de 58 VM / noeud de cluster, type de cluster Windows ou Linux).
  • Stabilisation: déplacements préventifs de VM pour se prémunir contre les risques de saturation de l’infrastructure.
  • Performance: déplacements de VM sur un noeud ou un cluster mieux adapté à son profil de consommation de ressources pour optimiser les performances lors de pics. 

La seule fonctionnalité non déployée en production lors du pilote, mais testée en pré-production est le redimensionnement. Cette fonctionnalité est surtout implémentée dans le cloud public car elle permet l’adaptation dynamique des ressources allouées à la VM en fonction de ses besoins réels permettant ainsi au client de payer au plus près de ses besoins réels.

Pour conclure, la solution Turbonomic apporte une vraie valeur ajoutée pour une infrastructure cloud de taille moyenne à large en offrant une assistance opérationnelle aux équipes de production et l’optimisation des investissements et des coûts pour les décideurs.


Vous souhaitez en savoir plus ? Découvrez playground Distributed Cloud