n°37
Juillet
2017
Scientific Computing Forum : La planification du futur de notre infrastructure
Le calendrier pour le High-Luminosity LHC. © CERN

Après deux premières sessions en février et mai dernier, le prochain Scientific Computing Forum, qui réunit des experts dans le domaine des applications de calcul intensif du secteur public, se réunira le 27 octobre prochain au CERN.

L’une des principales motivations du CERN dans l’organisation du Scientific Computing Forum est le défi lancé par le futur accélérateur LHC haute luminosité (HL-LHC).

En effet, le traitement des données des expériences organisées au CERN a toujours poussé les limites des infrastructures informatiques associées. Cela a conduit par exemple au développement de la grille informatique, qui sert la communauté depuis 15 ans maintenant [1].

Grâce à cette infrastructure internationale de grille de calcul (WLCG), nous pourrons traiter les 50 Po de données attendues en 2017. Mais les expériences au LHC doivent évoluer si la physique des particules au CERN veut continuer à produire des résultats scientifiques de première classe. Dans un an, le LHC cessera de prendre des données afin d’effectuer une série de mises à niveau sur une période de 18 mois. Les principales mises à jour seront effectuées sur ALICE et LHCb, bien que tous les détecteurs et l’accélérateur soient concernés par des changements. Puis, en 2020, le « run 3 » débutera. Bien que cela représente déjà une augmentation du volume de données et des besoins de calcul, la communauté est assez confiante quant à sa capacité à traiter ces données dans les délais. La prise de données de 3 ans du « run 3 » sera suivie d’un arrêt plus long, d’un ordre de grandeur différent des précédents. ATLAS et CMS subiront de vastes changements et le LHC lui-même produira un faisceau beaucoup plus fort, c’est-à-dire qu’il augmentera sa luminosité d’un facteur 20 par rapport à aujourd’hui. Lors de la mise en production du LHC haute luminosité (HL-LHC), cette combinaison de détecteurs de résolution spatiale et temporale plus fine avec un faisceau plus fort produira plus d’événements et entraînera une importante augmentation du débit de données. Des estimations du volume attendu sont difficiles, car les détails de toutes les mises à jour doivent encore être définis. Mais une augmentation d’un facteur d‘environ 100 par rapport à aujourd’hui est d’ores et déjà considérée, tant pour le volume de données à traiter que la puissance de calcul nécessaire.

Le statut du Scientific Computing Forum

Le Scientific Computing Forum réunit des experts dans le domaine des applications de calcul intensif du secteur public pour définir les solutions répondant aux besoins de la prochaine décennie. En développant le succès de la grille mondiale LHC (WLCG) et englobant les derniers développements des Scientific Clouds, la science continuera à conduire et à diriger le développement d’une installation de calcul de pointe. Le forum prend en compte les développements de l’informatique et du calcul dans le but d’identifier les options et les synergies pour des solutions adéquates et abordables.

Puisque la tâche est plutôt difficile, la discussion est ouverte à de nouvelles approches. Par exemple, certaines propositions indiquent un modèle dans lequel les données seront stockées dans un petit nombre (5-10) de grands centres du monde entier. De plus, l’informatique devrait alors être concentré dans les centres Tier-1 (par exemple le CC-IN2P3) et dans quelques-uns des grands centres Tier-2. Ce point de vue a par exemple été présenté par Ian Bird (CERN).

L’IN2P3 est représenté dans le forum et participe activement aux discussions. A titre d’exemple, voir la présentation sur IN2P3 Computing Outlook lors du dernier Computing Forum. Cette participation est signe que l’Institut souhaite maintenir sa structure avec une forte expertise dans les centres Tier-1 et Tier-2.

Bien que la participation à la réunion soit faite uniquement par invitation, les présentations et les comptes rendus des réunions sont accessibles au public.

En quoi cela vous intéresse ?

Si la façon dont WLCG organise le calcul change, il aura un impact certain sur l’activité non seulement des 30 collègues environ qui travaillent directement pour LCG-France mais également pour tous les membres du réseau. À ce jour, notre infrastructure de calcul est dominée par la nécessité de servir LCG-France. Si nous devions changer le modèle de calcul WLCG, cela pourrait avoir un impact significatif sur la mise en place de l’infrastructure informatique et des ressources humaines.

Un autre aspect important est que nous ne devons pas seulement considérer les expériences LHC dans le contexte de notre infrastructure de calcul. Au cours des prochaines années, d’autres expériences avec calcul et données intensives deviendront opérationnelles, telles que LSST, Euclid, CTA et KM3NeT. En outre, la physique nucléaire, surtout en vue de Spiral-2, se prépare à centraliser plus fortement sa gestion des données et éventuellement ses plates-formes d’analyse. Pour relever ce défi, un groupe de travail au niveau de l’IN2P3 discute des perspectives d’une infrastructure informatique commune pour la physique nucléaire. De plus, en janvier 2017, un projet pilote dans ce contexte a été lancé afin de fournir une plate-forme d’analyse pour AGATA, une autre expérience de physique nucléaire.

Ainsi, nous devrons partager l’infrastructure de calcul afin de servir tous les projets scientifiques soutenus par l’IN2P3.

Le Scientific Computing Forum du CERN jouera un rôle majeur dans la définition de ce qui sera calculé et stocké, où et comment. Suivre cette discussion est vital pour nous afin de préparer notre propre infrastructure. Participer ici offre la possibilité d’influencer l’avenir de l’informatique en France. Vous êtes invités à donner votre opinion - soit directement à moi, soit dans le cadre du travail pour la perspective de l’IN2P3, qui commencera cette année et qui fournira dans l’année à venir une feuille de route pour la recherche en informatique et l’évolution de notre infrastructure de calcul.

Forum février 2017 : https://indico.cern.ch/event/581096/ Forum mai 2017 : https://indico.cern.ch/event/619438/

Volker BECKMANN (Direction IN2P3)

[1] Par exemple Foster & Kesselman 2003, “The Grid 2”, Elsevier

Rechercher
     

Directeur de la publication  : Alain FUCHS.
Responsable éditorial : Volker BECKMANN, Pierre-Etienne MACCHI.
Comité de rédaction : David CHAMONT, Frédérique CHOLLET LE FLOUR, Virginie DELEBARRE DUTRUEL, Dirk HOFFMANN et Gaëlle SHIFRIN.

logo CCIN2P3
© CCIN2P3