n°34
Juillet
2016
"L’évolution de notre infrastructure de calcul est un réel défi. Face au déluge de données issues de nos expériences, nous devons être proactifs"

Volker Beckmann, Directeur Adjoint Scientifique Calcul et Données à l’IN2P3

- Pourriez-vous rappeler brièvement votre parcours et expliquer ce qui vous a amené à accepter le rôle de DAS Calcul et Données ?

J’ai fait une thèse en astrophysique à l’Université de Hambourg durant laquelle je travaillais déjà sur les balayages du ciel et l’identification automatique d’objets célestes. Après cela, j’ai fait un post-doc à l’INTEGRAL Science Data Center (IDSC) à Genève afin de développer un pipeline d’analyse de données pour l’un des instruments du satellite INTEGRAL de l’ESA. En 2003, j’ai été employé au Goddard Space Flight Centre de la NASA, près de Washington D.C. en tant que responsable du support utilisateurs d’INTEGRAL et j’ai eu également l’opportunité d’enseigner l’astrophysique à l’Université du Maryland (Comté de Baltimore). Je suis ensuite retourné à l’ISDC en 2007 en tant que responsable de projet pour les activités d’analyse de données d’INTEGRAL. J’ai rejoint le CNRS en 2009 et suis devenu responsable scientifique du Centre François Arago, un centre de calcul et d’analyse de données pour les expériences d’astroparticules au sol et dans l’espace. En 2010, j’ai obtenu mon Habilitation à Diriger les Recherches et ai été titularisé en 2013 comme ingénieur de recherche expert en calcul scientifique.

- Quel est le périmètre de votre mission et comment s’articule votre rôle au sein de la direction de l’Institut ?

Le principal objectif de la nouvelle direction de l’IN2P3 est de développer et de coordonner les activités de recherche en calcul appliqué à la physique nucléaire, à la physique des particules, l’astroparticule et à la cosmologie (domaines regroupés sur l’acronyme NPAC) au sein de l’Institut. Cela inclut de coordonner ces activités de recherche avec les institutions partenaires, aussi bien en France qu’à l’étranger, dont l’Union Européenne.

Un point très important est la formation : j’entends par là non seulement la formation sur des sujets spécifiques mais aussi la capacité à faire un master, une thèse et finalement, à obtenir une habilitation dans ce domaine du calcul appliqué, par exemple.

L’évolution de notre infrastructure de calcul est un réel défi. Face au déluge de données issues de nos expériences, nous devons être proactifs, en particulier en continuant à travailler à l’évolution de la grille et du CC-IN2P3. Il faut également discuter de la concentration optimale de l’infrastructure de calcul, par exemple en termes de mésocentres dédiés à la NPAC et supportés par l’IN2P3.

- Quelles priorités vous fixez-vous ?  

Ma première priorité est de déterminer qui est engagé dans la recherche en calcul appliqué au sein de l’IN2P3. Nous souhaitons soutenir ces activités dans ce domaine en identifiant des équipes et des projets dans les laboratoires de l’IN2P3. Malheureusement, afin de pouvoir prendre en compte ces projets dès l’an prochain, nous allons devoir les identifier et les soumettre très vite. Or j’ai pu visiter certains laboratoires depuis ma prise de fonctions il y a deux mois mais pas tous. Il y a une certaine activité en recherche sur le calcul appliqué à l’IN2P3 mais il serait bien d’accompagner non seulement celle-ci mais également d’encourager des collaborations au sein de l’IN2P3 et au-delà.

Un autre point urgent est l’évolution de l’infrastructure de calcul de l’IN2P3. Concernant la grille, nous avons décidé de renouveler la convention actuelle pour une année seulement et de la mettre à profit afin d’avoir le temps de décider d’une stratégie solide à moyen terme. La grille a été extrêmement efficace mais nous allons faire face à des défis énormes avec les prochains runs du LHC en terme de volumes de données et de besoins de calcul. Dans le même temps, les projets d’astroparticules vont commencer à produire des quantités significatives de données. Nous devons trouver un moyen de fournir le soutien nécessaire aux projets dans un budget contraint. Il sera alors peut-être nécessaire de penser à des solutions incluant par exemple l’utilisation de clouds commerciaux, d’infrastructures HPC locales et des approches hybrides. Cette discussion est également en lien avec le futur European Open Science Cloud (EOSC).

Enfin, je suis impatient de travailler avec France Grilles, LCG, le CC-IN2P3 et tous les autres partenaires impliqués afin de fournir la meilleure infrastructure de calcul pour la science de l’IN2P3 !

- Comment envisagez-vous la recherche en informatique à l’IN2P3 ? Comment serait-il possible de faire "émerger" ces projets et sur quels sujets, selon vous ?

Nous avons de très intéressants projets en cours dans ce domaine ! Certaines recherches mènent directement à des publications dans des revues en informatique. Nous voudrions identifier les équipes, aussi bien les chercheurs que les ingénieurs, dans les laboratoires qui pourraient constituer des équipes Calcul dédiées. Ils pourront alors proposer des projets soit existants, soit nouveaux pour obtenir un soutien direct de l’IN2P3 de la même manière que les projets expérimentaux. Pour toute la partie de l’informatique qui vient en soutien aux expériences, nous souhaiterions renforcer les activités transverses au sein de l’Institut mais aussi en direction d’autres partenaires. Nous avons déjà de bonnes initiatives qui vont dans ce sens, telles que la HEP Software Foundation, le RI3 et le CCRI. Mais nous souhaiterions former de plus petites équipes collaborant sur des sujets tels que le Machine Learning, le Big Data, le HPC et autres sujets émergents. Si cela s’avère utile, nous pourrions former des groupes de recherche GdR sur des sujets de recherche spécifiques.

- Selon vous, que faut-il retenir du colloque calcul de juin 2015 ? Que pensez-vous par exemple de l’idée évoquée à cette occasion, de promouvoir la mutualisation autour de projets ou thèmes forts, d’assurer la cohérence et de mettre en perspective nos contributions aux différents projets européens ?

Nous devons certainement travailler en collaboration plus étroite au sein de l’Institut sur certaines activités transverses. De plus, dans notre domaine, les financements dépendent de plus en plus de notre capacité à répondre à des appels à projets européens, à travailler au-delà des frontières et à prendre les responsabilités dans de grandes collaborations, comme par exemple l’EOSC. Quasiment toutes nos expériences sont internationales, c’est également le cas pour le calcul. Toutefois, chacun sait combien il est difficile d’identifier les appels Horizon 2020 les mieux adaptés, d’organiser une équipe internationale et d’aboutir à des réponses cohérentes, fortes et concises. Nous devrions pour cela faire équipe car le poids de la réussite à un appel H2020 peut être trop lourd pour un seul laboratoire IN2P3. Nous pouvons également tous profiter de nos expériences passées. J’estime qu’il est de la responsabilité de la direction de l’IN2P3 d’identifier les opportunités auxquelles nous devrions répondre et d’animer la collaboration, comme le fait Ursula Bassler pour l’EOSC.

- Il existe à l’IN2P3 un écosystème autour du calcul et des données qui assure "l’informatique au quotidien", l’administration systèmes et réseaux, le bon fonctionnement des infrastructures de calcul mais aussi et surtout, le support aux utilisateurs présents dans les laboratoires. Quelle est la stratégie de la nouvelle direction dans ce domaine ?

On ne change pas une équipe qui gagne ! ;-) En même temps, ce serait intéressant d’avoir une meilleure vision de qui fait quoi dans les laboratoires, et notamment dans les projets. Il n’est pas toujours clair, du moins pour moi, qui est en charge de calcul pour un projet dans chacun des laboratoires impliqués. Centraliser l’information nous permettrait de contacter plus facilement les collègues afin de distribuer une information spécifique ou de réagir à un problème particulier. Je voudrais signaler, qu’au sein de la direction de l’IN2P3, l’interlocuteur des services informatiques des laboratoires, comme pour les autres services techniques, est le directeur adjoint technique (DAT), Christian Olivetto. Mais il y a évidemment un recouvrement avec les aspects scientifiques et donc avec mon rôle de directeur adjoint scientifique Calcul et Données. Je suis donc curieux de participer aux réunions du CCRI et évidemment aux Journées Informatique.

Propos reccueillis par Gaëlle SHIFRIN