beandeau>
Plugin SLURM d'Incitation des Utilisateurs
Fanny Dufossé  1@  , Abdessalam Benhari  1, 2  , Denis Trystram  1  
1 : Data Aware Large Scale Computing
Centre Inria de l'Université Grenoble Alpes, Laboratoire d'Informatique de Grenoble
2 : Atos Bull
Atos-Bull

L'impact carbone des plateformes de Calcul Haute Performance (HPC) est élevé, surtout lorsque des politiques d'allocation de jobs classiques telles que le *FCFS (First-Come, First-Served)* sont utilisées. Ces techniques d'ordonnancement par défaut ne tiennent souvent pas compte de la flexibilité possible des utilisateurs, et de nombreux utilisateurs manquent de connaissances suffisantes concernant la consommation d'énergie associée à leurs soumissions. En conséquence, ces mécanismes par défaut contribuent à des émissions de CO2 inutilement élevées.

Bien que des techniques avancées de réduction du carbone – que ce soit par des politiques d'ordonnancement améliorées ou des optimisations matérielles – puissent atténuer cet impact, leur efficacité est relativement limitée en l'absence d'une prise en compte des comportements des utilisateurs. Ils préfèrent s'en tenir à des pratiques simples et bien établies qu'ils connaissent, évitant ainsi les nouvelles politiques, même lorsque celles-ci démontrent de meilleurs performances tant sur les temps d'exécution que sur l'énergie consommée. Ils ont tendance à fournir des paramètres tels que le "wall time" (temps prévu de fin d'exécution) et les nœuds demandés en se basant sur la routine plutôt que sur une compréhension approfondie des besoins réels de leurs jobs ou de l'état futur potentiel du système.

------------------------------------------------------------------------

Notre Approche : Influencer le Comportement des Utilisateurs

Nous explorons ici l'impact des comportements des utilisateurs et des décisions d'ordonnancement sur les émissions de carbone globales des systèmes HPC, dans le contexte de plusieurs mécanismes d'incitation. Pour ce faire, les utilisateurs reçoivent des informations détaillées sur leurs soumissions de jobs, y compris des estimations de l'empreinte carbone et de la consommation d'énergie. Plus important encore, le processus de prise de décision reste entièrement entre les mains des utilisateurs.

Notre approche vise à inciter les utilisateurs à :

Sélectionner des périodes de soumission plus appropriées.
Améliorer la précision de leurs paramètres de soumission.
Par conséquent, offrir une plus grande flexibilité à
l'ordonnanceur, quelle que soit la priorité des tâches.

En communiquant aux utilisateurs des informations importantes sur la soumission de leurs jobs et d'autres données utiles, nous émettons l'hypothèse que leurs pratiques de soumission s'amélioreront avec le temps. Un tel retour d'information devrait conduire à des données de soumission plus fiables et précises, et encourager la sélection de dates de soumission meilleures. Par exemple, si les utilisateurs sont informés des variations prévues du taux de carbone du mixte énergétique instantané et/ou de la charge prévue du système, ils pourraient être enclins à retarder des jobs non urgentes à des périodes caractérisées par de faibles taux de carbone et/ou une charge système réduite. De tels changements pourraient réduire leur empreinte carbone globale et/ou leur temps d'attente en file d'attente.

------------------------------------------------------------------------


Le Plugin SLURM d'Incitation des Utilisateurs

Le plugin SLURM d'incitation (user incentive) est un module logicielle de SLURM dont l'objectif est d'augmenter l'engagement des utilisateurs dans les processus d'ordonnancement et de surveillance des environnements HPC. Le plugin s'intègre de manière transparente avec le gestionnaire de charge de travail SLURM et ses autres composants sans interférer avec ses fonctionnalités existantes, tout en fournissant un précieux retour d'information en temps réel sur la consommation d'énergie des tâches et les estimations de l'empreinte carbone.

Cette information supplémentaire donne aux utilisateurs la possibilité de retarder ou de modifier leurs soumissions afin de minimiser leur impact environnemental ou d'améliorer la qualité de leurs paramètres de soumission. Le plugin contient plusieurs composants, y compris des outils de prédiction de durées d'exécution de jobs et de l'empreinte carbone, des métriques et des mécanismes d'interaction avec l'utilisateur. Ces éléments fonctionnent ensemble pour fournir une interface d'ordonnancement simple, dynamique et interactive qui offre différentes fonctionnalités et informations aux utilisateurs.



  • Poster
Chargement... Chargement...