Back to Search
Start Over
Data-driven adaptable hardware accelerators for graph neural networks
- Publication Year :
- 2024
-
Abstract
- Les xarxes neuronals de grafs (GNNs) excel·leixen en tasques com la classificació de nodes, la predicció d'arestes i la classificació de grafs, amb aplicacions en sistemes de recomanació, anàlisi de xarxes i bioinformàtica. La necessitat d'una computació eficient ha motivat l'augment dels acceleradors de hardware per a GNNs. Com es comporten diferents configuracions d'acceleradors en grafs amb diferents propietats és un tema inexplorat, limitant l'adaptabilitat dels acceleradors de GNN a diferents grafs d'entrada. Aquesta tesi introdueix una metodologia basada en dades per predir la latència i millorar les decisions de configuració adaptativa tant per a acceleradors amb un flux de dades flexibles com fixe. Les contribucions inclouen la creació d'un conjunt de dades, el disseny de models de predicció de latència, el desenvolupament d'un marc per determinar la importància de les propietats dels grafs i el desenvolupament de mètodes de planificació per a entorns d'un sol accelerador i multi-acceleradors heterogenis amb tècniques de programació lineal entera (ILP). Les avaluacions experimentals mostren que la precisa predicció de la latència porta a millores en el rendiment tant en entorns d'un sol accelerador com en entorns multi-acceleradors.<br />Graph Neural Networks (GNNs) excel in tasks like node classification, edge predic- tion, and graph classification, with applications in recommendation systems, network ana- lysis, and bioinformatics. The need for efficient computation motivated the rise of GNN hardware accelerators. How different accelerator configurations perform on graphs with different properties remains unexplored, limiting the adaptability of GNN accelerators to different graph inputs. This thesis introduces a data-driven approach to predict latency and improve adaptive configuration decisions for both flexible-dataflow and fixed-dataflow GNN accelerators. Contributions include creating a comprehensive dataset, designing latency prediction models, developing a framework for feature importance and develop- ing scheduling methods for single-accelerator and heterogeneous multi-accelerator settings with Integer Linear Programming (ILP) techniques. Experimental evaluations show that accurate latency prediction leads to performance improvements in both single and multi- accelerator settings.
Details
- Database :
- OAIster
- Notes :
- application/pdf, English
- Publication Type :
- Electronic Resource
- Accession number :
- edsoai.on1461019628
- Document Type :
- Electronic Resource