Le monde numérique au service de la certification et de la sécurisation des systèmes 

Soutenance de thèse_ Xavier LACOSTE_18 Février 2015_14h

Xavier Lacoste soutiendra sa thèse intitulée "Ordonnancement et optimisations mémoire pour un solveur creux par méthodes directes sur des machines hétérogènes", le mercredi 18 février à 14h00 dans la salle Ada Lovelace (Inria).

Composition du jury:
Alfredo BUTTARI (Examinateur)
Frédéric DESPREZ (Examinateur)
Iain S. DUFF (Examinateur)
Guillaume LATU (Encadrant)
Boniface NKONGA (Examinateur)
François PELLEGRINI (Directeur de thèse)
Pierre RAMET (Co-directeur de thèse)


Résumé:
L’évolution courante des machines montre une croissance importante dans le nombre et l’hétérogénéité des unités de calcul. Les développeurs doivent alors trou- ver des alternatives aux modèles de programmation habituels permettant de produire des codes de calcul à la fois performants et portables. PaStiX est un solveur par- allèle de système linéaire creux par méthodes directe. Il utilise un ordonnanceur de tâche dynamique pour être efficaces sur les machines modernes multi-cœurs à mémoires hiérarchiques. Dans cette thèse, nous étudions les bénéfices et les limites que peut nous apporter le remplacement de l’ordonnanceur interne, très spécialisé, du solveur PaStiX par deux systèmes d’exécution génériques : PaRSEC et StarPU. Pour cela l’algorithme doit être décrit sous la forme d’un graphe de tâches qui est fournit aux systèmes d’exécution qui peuvent alors calculer une exécution optimisée de celui-ci pour maximiser l’efficacité de l’algorithme sur la machine de calcul visée. Une étude compara- tive des performances de PaStiX utilisant ordonnanceur interne, PaRSEC, et StarPU a été menée sur différentes machines et est présentée ici. L’analyse met en évidence les performances comparables des versions utilisant les systèmes d’exécution par rapport à l’ordonnanceur embarqué optimisé pour PaStiX. De plus ces implémentations per- mettent d’obtenir une accélération notable sur les machines hétérogènes en utilisant les accélérateurs tout en masquant la complexité de leur utilisation au développeur. Dans cette thèse nous étudions également la possibilité d’obtenir un solveur distribué de sys- tème linéaire creux par méthodes directes efficace sur les machines parallèles hétérogènes en utilisant les systèmes d’exécution à base de tâche. Afin de pouvoir utiliser ces travaux de manière efficace dans des codes parallèles de simulations, nous présentons également une interface distribuée, orientée éléments finis, permettant d’obtenir un assemblage op- timisé de la matrice distribuée tout en masquant la complexité liée à la distribution des données à l’utilisateur.


Dernière mise à jour jeudi 12 février 2015


HAUT