Back to Search Start Over

Spatio-temporal thermal-aware scheduling for homogeneous high-performance computing datacenters

Authors :
Patricia Stolf
Hongyang Sun
Jean-Marc Pierson
École normale supérieure de Lyon (ENS de Lyon)
Optimisation des ressources : modèles, algorithmes et ordonnancement (ROMA)
Inria Grenoble - Rhône-Alpes
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP)
École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL)
Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL)
Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)
Système d’exploitation, systèmes répartis, de l’intergiciel à l’architecture (IRIT-SEPIA)
Institut de recherche en informatique de Toulouse (IRIT)
Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université de Toulouse (UT)-Toulouse Mind & Brain Institut (TMBI)
Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)
ANR-10-LABX-0070,MILYON,Community of mathematics and fundamental computer science in Lyon(2010)
European Project: 288701,EC:FP7:ICT,FP7-ICT-2011-7,COOLEMALL(2011)
École normale supérieure - Lyon (ENS Lyon)
Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Université Claude Bernard Lyon 1 (UCBL)
Université de Lyon-École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL)
Université de Lyon-École normale supérieure - Lyon (ENS Lyon)
Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées
Centre National de la Recherche Scientifique - CNRS (FRANCE)
Ecole Normale Supérieure de Lyon - ENS de Lyon (FRANCE)
Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
Institut National de la Recherche en Informatique et en Automatique - INRIA (FRANCE)
Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université Toulouse 1 Capitole - UT1 (FRANCE)
Institut de Recherche en Informatique de Toulouse - IRIT (Toulouse, France)
Institut National Polytechnique de Toulouse - INPT (FRANCE)
Source :
Future Generation Computer Systems, Future Generation Computer Systems, 2017, 71, pp.157-170. ⟨10.1016/j.future.2017.02.005⟩, Future Generation Computer Systems, Elsevier, 2017, 71, pp.157-170. ⟨10.1016/j.future.2017.02.005⟩
Publication Year :
2017
Publisher :
Elsevier BV, 2017.

Abstract

Datacenters have become an important part of todays computing infrastructure. Recent studies have shown the increasing importance of thermal considerations to achieve effective resource management. In this paper, we study thermal-aware scheduling for homogeneous high-performance computing (HPC) datacenters under a thermal model that captures both spatial and temporal correlations of the temperature evolution. We propose an online scheduling heuristic to minimize the makespan for a set of HPC applications subject to a thermal constraint. The heuristic leverages the novel notion of thermal-aware load to perform both job assignment and thermal management. To respect the temperature constraint, which is governed by a complex spatio-temporal thermal correlation, dynamic voltage and frequency scaling (DVFS) is used to regulate the job executions during runtime while dynamically balancing the loads of the servers to improve makespan. Extensive simulations are conducted based on an experimentally validated datacenter configuration and realistic parameter settings. The results show improved performance of the proposed heuristic compared to existing solutions in the literature, and demonstrate the importance of both spatial and temporal considerations. In contrast to some scheduling problems, where DVFS introduces performanceenergy tradeoffs, our findings reveal the benefit of applying DVFS with both performance and energy gains in the context of spatio-temporal thermal-aware scheduling. Thermal model capturing both spatial and temporal temperature correlations in datacenters.Formulation of a spatio-temporal thermal-aware scheduling problem for HPC applications.Scheduling heuristic using thermal-aware load for job assignment and thermal management.Simulations to show the effectiveness of heuristic under a wide range of parameters.

Details

ISSN :
0167739X
Volume :
71
Database :
OpenAIRE
Journal :
Future Generation Computer Systems
Accession number :
edsair.doi.dedup.....3ed49f85b85065a846db5c65cf05661f