imprimer
n°24
Juillet
2013
Une collaboration pour faire avancer la recherche en infectiologie

L’institut de recherche technologique BIOASTER, le Centre de Calcul de l’IN2P3 et la société SysFera collaborent depuis février 2012 pour concevoir et déployer la plateforme de calcul scientifique de BIOASTER dédiée à la bio-informatique. Actuellement à l’état de prototype, la plateforme passera en préproduction fin septembre 2013 : BIOASTER va fournir les applications et les données brutes, le Centre de Calcul de l’IN2P3 va fournir l’infrastructure de stockage et d’analyse, et SysFera va fournir l’interface entre les utilisateurs et le système grâce à l’intergiciel SysFera-DS.

BIOASTER est l’un des 8 Instituts de Recherche Technologique français fondés grâce au programme des Investissements d’Avenir, et le seul dans le domaine de la santé. Le projet BIOASTER a été porté conjointement par Lyonbiopôle, le pôle de compétitivité lyonnais dédié aux biotechnologies, et l’Institut Pasteur, fondation dédiée à la recherche, la santé publique et l’enseignement dans le domaine des maladies en priorité infectieuses. Les autres membres fondateurs sont l’Institut Mérieux, Sanofi, Danone Research, mais aussi le CNRS, l’INSERM et le CEA. Il s’agit en fait d’un modèle inédit de partenariat entre public et privé dont l’objectif est de lever les verrous technologiques bloquant le passage de la preuve de concept au produit exploitable. BIOASTER va focaliser cette recherche (...)

lire la suite

Biarritz, 21-25 janvier 2013

ENVOL 2012 – Développement collaboratif pour le logiciel libre

L’édition 2012 de l’action nationale de formation (ANF) « ENVOL », organisée sous les auspices du projet PLUME, s’est déroulée à Biarritz du 21 au 25 janvier 2013. Coorganisée par le CNRS (via PLUME, la DSI et des laboratoires du CNRS) avec la participation d’Inria, elle a accueilli cinquante participants et seize intervenants. Depuis 2008, PLUME propose tous les deux ans environ, une formation pour le dEveloppemeNt et la ValOrisation des Logiciels en environnement de recherche. Celle de 2012 avait subi un léger décalage dans son planning. Les deux premières éditions ont permis de faire un point sur les méthodes et outils de développement de logiciels, sur les moyens de valorisation de ces logiciels (ENVOL2008), avec un aspect plus concret de mise en oeuvre et d’utilisation (ENVOL2010). Cette édition d’ENVOL, financée dans le cadre des ANF avec une contribution importante de la DSI du CNRS, a eu pour ambition de renforcer la collaboration entre utilisateurs et/ou développeurs de codes (libres dans la majorité des cas), en se (...)

lire la suite

LCG France

Bientôt 10 ans - Frédérique Chollet fait le bilan de LCG France

Comme beaucoup, j’ai côtoyé la physique des particules avant de m’orienter très vite vers les sciences de l’ingénieur. J’en garde une curiosité pour les enjeux scientifiques de l’IN2P3. Je fais « depuis toujours » partie du service informatique du Laboratoire d’Annecy-le-Vieux de Physique des Particules. Mon parcours m’a ouvert de multiples horizons allant de l’acquisition et traitement en temps réel jusqu’au « Grid Computing » pour les expériences LHC. Même avec des objectifs à très long terme, l’exigence au quotidien des collaborations internationales, l’évolution des technologies, les échanges entre collègues, tout nous incite à aller de l’avant. C’est encore le cas aujourd’hui dans le cadre de LCG-France. Le projet a été initié en 2004 par l’IN2P3/CNRS en collaboration avec l’IRFU/CEA. Il a pour objectif de répondre aux besoins de calcul des expériences LHC en France et de maintenir opérationnels au sein de WLCG (Worlwide LHC Computing Grid), les différents centres de type Tier-1 au CC-IN2P3 et Tier-2/Tier-3 (type mésocentre) présents à (...)

lire la suite

Réseau

La bande passante de RENATER largement occupée par les données du LHC

Fairouz Malek, responsable scientifique du projet LCG-France, l’a rappelé dans une interview publiée dans le rapport d’activité de RENATER : "Si le réseau n’est pas performant, rien ne se passe". A consulter ce rapport, on peut en effet constater que les données du LHC occupent une très grande partie du réseau déployé par RENATER. On peut par exemple y lire "En 2012, RENATER contribue activement à la mise en place de la partie française du réseau LHCONE (LHC Open Network Environment) destinée à transmettre rapidement les énormes masses de données générées par les expériences menées au CERN dans le cadre du projet Large Hadron Collider (LHC). Réalisé en collaboration avec la communauté de la physique des particules (HEP/Large Hadron Collider Computing Grid), le réseau LHCONE permet de distribuer à très haut débit ces données aux sites participant aux expériences, en particulier le centre de calcul de premier niveau Tier1 de l’IN2P3 à Villeurbanne, et les centres de second niveau Tier2, comme le GRIF (Ile-de-France) ou Subatech (Nantes)." (...)

lire la suite

LLR, 28-30 mai 2013 (Ecole polytechnique, Palaiseau)

12ème édition des Rencontres LCG-France

LCG-France organise traditionnellement deux rencontres par an au cours desquelles sont discutés l’état d’avancement du projet, l’évolution de l’infrastructure des sites et les activités de calcul des expériences LHC. Du 28 au 30 mai derniers, la session du printemps 2013 s’est tenue à l’école polytechnique à Palaiseau, organisée localement par le LLR et en particulier avec l’aide très précieuse d’Andrea Sartirana. Elle a réuni au total sur les 3 jours, près de 70 participants. Andrea Sartirana (resp. technique GRIF - LLR) Les enjeux pour la période de redémarrage du LHC après le 1er Long Shutdown (LS1) ont été évoqués par les orateurs de CMS et d’ATLAS. Comme chaque fois, la session réseau a permis de mesurer le chemin parcouru dans ce domaine. Le déploiement en France du LHCONE, réseau visant à fournir une connectivité très haut débit pour les communications entre les sites Tier1 et Tier2 est l’un des faits marquants de ces deux dernières années. Au fil des ans, la collaboration avec RENATER, l’implication des experts réseau du CC-IN2P3 et de l’Irfu (CEA) se sont révélées (...)

lire la suite

Agenda
ADASS, du 20 sept. au 3 oct.
The Astronomical Data Analysis Software and Systems (ADASS) conference is held each year at a (...)

en savoir plus

CHEP, du 14 au 18 octobre
La 20e édition de CHEP (Conference on Computing in High Energy and Nuclear Physics) se déroulera (...)

en savoir plus

JRES, du 10 au 13 décembre
L’édition 2013 des JRES aura lieu au CORUM à Montpellier du 10 au 13 décembre 2013. Depuis 1995, (...)

en savoir plus

Rechercher
Abonnement
Pour vous abonner/désabonner, suivez ce lien.
Proposer un article
Vous souhaitez proposer un article ? Envoyez un mail à LettreInformatique@in2p3.fr.
logo CCIN2P3
© 2013 CCIN2P3
n°24
Juillet
2013
Une collaboration pour faire avancer la recherche en infectiologie

L’institut de recherche technologique BIOASTER, le Centre de Calcul de l’IN2P3 et la société SysFera collaborent depuis février 2012 pour concevoir et déployer la plateforme de calcul scientifique de BIOASTER dédiée à la bio-informatique. Actuellement à l’état de prototype, la plateforme passera en préproduction fin septembre 2013 : BIOASTER va fournir les applications et les données brutes, le Centre de Calcul de l’IN2P3 va fournir l’infrastructure de stockage et d’analyse, et SysFera va fournir l’interface entre les utilisateurs et le système grâce à l’intergiciel SysFera-DS.

BIOASTER est l’un des 8 Instituts de Recherche Technologique français fondés grâce au programme des Investissements d’Avenir, et le seul dans le domaine de la santé. Le projet BIOASTER a été porté conjointement par Lyonbiopôle, le pôle de compétitivité lyonnais dédié aux biotechnologies, et l’Institut Pasteur, fondation dédiée à la recherche, la santé publique et l’enseignement dans le domaine des maladies en priorité infectieuses. Les autres membres fondateurs sont l’Institut Mérieux, Sanofi, Danone Research, mais aussi le CNRS, l’INSERM et le CEA. Il s’agit en fait d’un modèle inédit de partenariat entre public et privé dont l’objectif est de lever les verrous technologiques bloquant le passage de la preuve de concept au produit exploitable. BIOASTER va focaliser cette recherche technologique dans trois domaines d’intervention :

-  la recherche et le développement de nouveaux traitements thérapeutiques pour traiter les maladies infectieuses ;

-  la recherche et le développement de nouveaux outils de diagnostic pour mieux cibler les traitements des maladies infectieuses ;

-  la recherche et le développement de nouveaux outils pour étudier et exploiter le microbiome, c’est-à-dire la flore microbienne qui colonise le corps humain, notamment le tube digestif.

Le Centre de Calcul de l’IN2P3, un partenaire naturel pour la bio-informatique de BIOASTER

Mais pourquoi collaborer avec le centre de calcul de l’IN2P3 ? L’amélioration et la miniaturisation des technologies en biochimie et biologie moléculaire génèrent de plus en plus de données de plus en plus facilement ; typiquement, il est désormais possible de séquencer le génome d’une bactérie pour environ mille euros. Mais ces technologies fournissent uniquement un résultat brut qu’il faut décrypter, annoter, puis analyser afin que le biologiste lui donne un sens. C’est le rôle de la bio-informatique. La masse d’informations à analyser justifie l’emploi d’une infrastructure de stockage et d’analyse haut débit. Le Centre de Calcul de l’IN2P3 a un savoir-faire reconnu en stockage et analyse de données. Il est donc un partenaire logique et indispensable pour la conception et le déploiement de l’infrastructure bio-informatique de BIOASTER. D’un côté, BIOASTER bénéficiera des méthodes de stockage et de sauvegarde mis en place pour les expériences de physique des hautes énergies. De l’autre côté, BIOASTER va participer directement à la mise en place du service d’infrastructure virtualisée, basé sur OpenStack.

OpenStack comme solution d’infrastructure mutualisée

En effet, BIOASTER souhaite pleinement participer à l’activité du Centre de Calcul de l’IN2P3. Le CC-IN2P3 héberge déjà un ingénieur de BIOASTER qui travaille à la mise en place de la plateforme bio-informatique et du support qui l’accompagne. D’ici septembre, il sera rejoint par un administrateur système qui travaillera au déploiement du service sous OpenStack. Le support, grâce à SysFera, va mettre en place le guichet auquel vont s’adresser les utilisateurs pour soumettre leurs calculs, que cela soit par ligne de commande ou par interface Web. L’administrateur système va travailler sur l’infrastructure OpenStack pour étendre la quantité de machines disponible et assurer la disponibilité du service.

Ensemble, BIOASTER, SysFera et le Centre de Calcul de l’IN2P3 forment un partenariat pour concevoir une plateforme bio-informatique originale et innovante à la fois sur son interface utilisateur et sur l’infrastructure sous-jacente.

Nicolas SAPAY

n°24
Juillet
2013
"Nos projets prendront forme autour de la communication, la valorisation, l’échange, la fédération et la compétitivité"

Giovanni Lamanna, Chargé de Mission pour l’Informatique (CMI) à l’IN2P3

Directeur de recherche CNRS/IN2P3, Giovanni Lamanna est le responsable scientifique de l’équipe de recherche en astronomie gamma du LAPP (Laboratoire d’Annecy-le-Vieux de Physique des Particules) impliquée dans l’expérience H.E.S.S. (High Energy Steresocopic System) et dans le projet CTA (Cherenkov Telescope Array).

Diplômé en physique à l’Université de Bari en Italie, son parcours de recherche débute au CERN (dans l’expérience CMS, puis dans AMS) où il obtient son doctorat de recherche et enchaine divers postdocs. C’est en 2004 qu’il a intégré l’IN2P3 dans l’expérience ANTARES au CPPM (Centre de Physique des Particules de Marseille). Tout au long de son parcours de chercheur Giovanni Lamanna se consacre à la physique des Astroparticules. Ses activités expérimentales se sont orientées vers le développement de logiciels scientifiques pour l’analyse de données ainsi que vers l’instrumentation de détection dans les domaines de l’électronique, de la mécanique et de la mécatronique. Il s’intéresse et il s’implique à différents niveaux dans des domaines variés de l’informatique et des sciences associées : coordinateur international du projet « Data Management » de CTA, promoteur du projet CTA Computing Grid et des initiatives de coopération internationale, e.g. des projets Européens et des ateliers internationaux « Aspera & Computing », représentant français dans LHC-CRSC « Computing Resources Scrutiny Group » au CERN.

Giovanni, en quoi consiste le rôle de Chargé de mission à l’informatique au sein de l’IN2P3 ?

La direction de l’IN2P3 confie des « missions » spécifiques de coordination et/ou animation sous sa directe responsabilité. Le Chargé de Mission pour l’Informatique (CMI) de l’IN2P3, sous la responsabilité du directeur adjoint scientifique responsable du calcul, Laurent Serin, participe à la définition, à l’organisation et à l’orientation de la mise en œuvre des moyens informatiques. A ce titre, le CMI assure la coordination de la stratégie de la politique de l’institut en termes de développement informatique et des sciences associées. Le CMI représente la direction de l’IN2P3 dans les instances à caractère national ou international. La ligne politique et stratégique de la direction de l’IN2P3, ainsi que les nouvelles responsabilités qu’elle souhaitait confier au CMI, m’ont persuadé de l’importance de ce rôle que j’ai voulu accepter avec un fort sens de service envers mon Institut et la recherche scientifique.

Pourrais-tu nous fournir quelque détail de cette « politique » et ces « défis » ?

Pour commencer, à l’intérieur de notre institut, des revues seront organisées en support des équipes de recherche impliquées dans des nouveaux projets où l’informatique et le calcul jouent un rôle important, pour bien saisir et évaluer leurs besoins et les soutenir dans leurs démarches. Plus de coordination est demandée au niveau national, visant à préparer l’institut, ses chercheurs et ses ingénieurs à jouer un rôle clé dans les nouvelles orientations prévues dès l’année prochaine. Je me réfère notamment aux actions attendues en faveur « des infrastructures numériques au service de la recherche » de l’Agenda Stratégique France-Europe 2020 du gouvernement. Au niveau international, « l’Agenda Numérique » du plan Horizon 2020 de la Commission Européenne prévoit une série d’actions de soutien au développement en informatique autour des sujets dans lesquels notre communauté est déjà bien active, e.g. le Cloud, l’accès aux données, les centres des données, l’émergence des nouvelles professionnalités. Pour finir, j’ai aussi la mission de veiller à la cohérence scientifique de la programmation de notre infrastructure de référence, le CC-IN2P3, ainsi que celle d’affirmer et de soutenir son rôle d’excellence sur la scène internationale. Le CCIN2P3 nous permet déjà à nous tous, chercheurs de l’IN2P3 et de l’IRFU, de jouer un rôle déterminant dans nos expériences dans le contexte du traitement des données scientifiques. A ces fins, le Directeur Adjoint Scientifique en charge de la Physique des Particules et du Calcul à l’IN2P3 (Laurent Serin), le chargé de mission pour l’informatique à l’IN2P3 et le directeur du CC-IN2P3 (Pierre-Etienne Macchi) travailleront en coordination.

Y a t-il des évolutions prévues dans l’organisation du CCRI ?

Avant tout, l’organisation de l’informatique au sein de l’IN2P3 et les rôles à jouer par les informaticiens de l’IN2P3 et de l’IRFU doivent se renforcer pour prendre part aux nouveaux défis et supporter le CMI dans ses démarches. Le CCRI, Conseil de Coordination du Réseau des Informaticiens de l’IN2P3 et l’IRFU, sera centré sur trois thèmes :

1. calcul et services pour l’analyse scientifique ;

2. contrôle des instruments et acquisition de données ;

3. services de soutien informatique et administration des systèmes ;

et les activités seront organisées dans des groupes de travail autour de ces thèmes. Les sujets ressortent à la fois de la proposition du CMI en cohérence avec la politique scientifique à mener et du réseau des informaticiens vers toutes les avancées technologiques. Un rôle important sera joué par un animateur du réseau et qui sera membre du CCRI.

Quels sont les projets que tu souhaites lancer au sein du CCRI ?

Pour commencer le premier projet est une institutionnalisation majeure du CCRI et un support formel pour ses actions. J’ai pris quelque temps pour étudier la situation et commencer à proposer quelques petites actions. J’ai besoin de beaucoup de participation et de support de la part de tous. Les mots clefs autour desquels nos projets prendront forme sont : communication, valorisation, échange, fédération et compétitivité. La nouvelle structuration et organisation de la communauté informatique se met désormais en place et nous reprendrons les travaux dans les prochains jours.

PROPOS RECUEILLIS PAR VIRGINIE DUTRUEL

n°24
Juillet
2013
ENVOL 2012 – Développement collaboratif pour le logiciel libre
Photo de groupe d'une partie des 50 participants et 16 intervenants de l'école ENVOL2012 devant le manoir du VTF domaine de Françon à Biarritz. (CC-by-nc-nd/3.0 Dirk Hoffmann)

L’édition 2012 de l’action nationale de formation (ANF) « ENVOL », organisée sous les auspices du projet PLUME, s’est déroulée à Biarritz du 21 au 25 janvier 2013. Coorganisée par le CNRS (via PLUME, la DSI et des laboratoires du CNRS) avec la participation d’Inria, elle a accueilli cinquante participants et seize intervenants.

Depuis 2008, PLUME propose tous les deux ans environ, une formation pour le dEveloppemeNt et la ValOrisation des Logiciels en environnement de recherche. Celle de 2012 avait subi un léger décalage dans son planning. Les deux premières éditions ont permis de faire un point sur les méthodes et outils de développement de logiciels, sur les moyens de valorisation de ces logiciels (ENVOL2008), avec un aspect plus concret de mise en oeuvre et d’utilisation (ENVOL2010).

Cette édition d’ENVOL, financée dans le cadre des ANF avec une contribution importante de la DSI du CNRS, a eu pour ambition de renforcer la collaboration entre utilisateurs et/ou développeurs de codes (libres dans la majorité des cas), en se focalisant sur le partage et la réutilisation de modèles et de codes logiciels dans la communauté de l’Enseignement Supérieur et de la Recherche.

Notre objectif a été de montrer que l’on peut mieux répondre aux besoins de développement logiciel exprimés par les utilisateurs et les développeurs en termes de fonctionnalités, en termes de technologies et de méthodes utilisées, en ayant une meilleure connaissance de la production logicielle de la communauté, donc en favorisant la collaboration entre les différents acteurs de ces logiciels.

Cette formation s’adressait à des personnels de laboratoires de recherche, chercheurs, ingénieurs ou doctorants, ayant une activité de développement. Chaque participant était invité à venir avec un portable permettant de faire tourner une machine virtuelle utilisée pour les TP proposés.

La formation s’est déroulée en une seule session pour les présentations sous forme de séminaires. Les participants ont été répartis en groupes pour les travaux pratiques réalisés. Cette formation a pu toucher une large représentation de personnels informaticiens de tous les domaines scientifiques du CNRS.

Les supports des présentations sont disponibles de façon publique sur le site PLUME selon les grands thèmes de l’école :

- Identification des pratiques actuelles et problèmes rencontrés par le biais de retours d’expérience sur des logiciels et des pratiques issus de la communauté ESR,

- Conception logicielle,

- Approche composants,

- Développement, validation et tests,

- Aspects organisationnels et juridiques,

- Documentation coopérative.

Le programme était complété par trois tables rondes autour des questions « banque de codes/composants/modèles pour et par la communauté », « Capitaliser, mutualiser les compétences et savoir-faire avec PLUME » et « Free/open access et reproductibilité de la recherche ». La dynamique de ce type d’école a permis en fin de session d’identifier des sujets que les participants aimeraient voir traiter lors d’éditions futures : ENVOL a été un succès cette fois-ci encore.

Enfin, plusieurs participants ont fait une critique constructive du site PLUME :

- Mise à disposition de moyens pour refaire les TP proposés lors d’ENVOL avec une aide légère de PLUME,

- Suivi ou aides pour permettre aux participants à une école ENVOL à diffuser en interne les connaissances acquises,

- Amélioration du « look and feel » du site PLUME, trop austère pour beaucoup de participants, trop riche en informations et donc difficile d’accès pour d’autres.

Nous tâcherons d’annoncer la prochaine édition d’ENVOL en temps et en heure dans une prochaine Lettre Informatique également et nous restons à votre disposition pour de plus amples informations, voire des idées et propositions de la part de nos lecteurs.

Véronique BAUDIN (LAAS), Dirk HOFFMANN (CPPM) - membres du comité d'organisation ENVOL2012

n°24
Juillet
2013
Bientôt 10 ans - Frédérique Chollet fait le bilan de LCG France
(de dr. à g.) Frédérique Chollet (LAPP) et Renaud Vernet (CC-IN2P3)

Comme beaucoup, j’ai côtoyé la physique des particules avant de m’orienter très vite vers les sciences de l’ingénieur. J’en garde une curiosité pour les enjeux scientifiques de l’IN2P3. Je fais « depuis toujours » partie du service informatique du Laboratoire d’Annecy-le-Vieux de Physique des Particules. Mon parcours m’a ouvert de multiples horizons allant de l’acquisition et traitement en temps réel jusqu’au « Grid Computing » pour les expériences LHC. Même avec des objectifs à très long terme, l’exigence au quotidien des collaborations internationales, l’évolution des technologies, les échanges entre collègues, tout nous incite à aller de l’avant. C’est encore le cas aujourd’hui dans le cadre de LCG-France.

Le projet a été initié en 2004 par l’IN2P3/CNRS en collaboration avec l’IRFU/CEA. Il a pour objectif de répondre aux besoins de calcul des expériences LHC en France et de maintenir opérationnels au sein de WLCG (Worlwide LHC Computing Grid), les différents centres de type Tier-1 au CC-IN2P3 et Tier-2/Tier-3 (type mésocentre) présents à l’IRFU et dans les laboratoires IN2P3 concernés. J’ai eu la chance de participer au montage et à la gestion du projet dès 2006 en tant que responsable de l’animation Tier-2/Tier-3 en collaboration avec Fabio Hernandez du CC-IN2P3, à l’époque responsable technique LCG-France.

Responsable technique du projet, l’équipe LCG-France

En 2010, Fairouz Malek du Laboratoire de Physique Subatomique et de Cosmologie de Grenoble, responsable scientifique LCG-France, Dominique Boutigny alors directeur du CC-IN2P3 et Etienne Augé, Directeur Adjoint Scientifique en charge de la Physique des Particules et du Calcul à l’IN2P3 de l’époque, m’ont fait confiance pour prendre la suite de Fabio Hernandez. J’ai accepté avec enthousiasme et confiance de prendre la relève pour 4 ans. L’enthousiasme était porté par l’annonce des premières données LHC, la confiance liée à la maturité du projet et une certaine idée du travail en équipe. Trois ans après, je suis restée dans le même état d’esprit… à quelques nuances près.

Le « tandem » avec Fairouz Malek fonctionne depuis de nombreuses années ; toutes les deux avons appris à « pédaler ensemble ». Nous faisons équipe avec Renaud Vernet, responsable du calcul LHC au CC-IN2P3 depuis le départ de Pierre Girard, et Yannick Patois de l’Institut pluridisciplinaire Hubert Curien de Strasbourg qui assure la coordination du forum technique des sites. Même si cela n’est jamais évident, au fil des ans l’équipe LCG-France a réussi à se renouveler, au moins en partie et c’est en soi un signe de bonne santé !

Les temps forts, mon rôle au quotidien

Chaque année, la vie du projet est marquée par des temps forts : en septembre, l’estimation et l’annonce des pledges, c.a.d les engagements pris au niveau international, vis-à-vis de la collaboration WLCG, en janvier, l’attribution du budget obligeant à réviser les prévisions faites à l’automne. Dans un autre ordre d’idée, je participe à l’organisation des deux sessions annuelles des rencontres LCG-France et la cinquantaine de participants réguliers contribue à en faire des moments privilégiés.

Mon rôle au quotidien, quel est-il vraiment ? J’ai un rôle d’animation et de suivi au sein de LCG-France. Je suis aussi en contact avec WLCG. Cela m’oblige à relayer beaucoup d’informations, organiser bon nombre de réunions. J’ai à cœur de tout faire pour qu’elles soient, sinon fructueuses, au moins intéressantes pour ceux qui y participent. Il faut oser des propositions et tenter des synthèses, entendre les remarques et tenter d’en tenir compte, reprendre et reprendre encore certains sujets problématiques ou n’ayant pas abouti. Parfois je me retrouve à gérer des épiphénomènes par mél alors qu’une bonne organisation projet devrait nous donner le temps de traiter des sujets de fond. Comme quoi, rien n’est parfait…

Solliciter les experts m’oblige à fouiller les sujets en amont et saisir leurs explications rapidement. Le monde du réseau est longtemps resté à mes yeux un monde d’experts, un peu à part, avec plein d’acronymes. Le calcul LHC a bousculé cette vision et je ne compte pas le nombre de questions posées à Jérôme Bernier et aux membres de l’équipe Télécom du Centre de Calcul. Au bout du compte, c’est très intéressant, satisfaisant parfois, mais cela demande pas mal d’énergie !

La communauté LCG-France

L’une des réussites est sans conteste d’avoir su mobiliser une communauté d’ingénieurs et physiciens autour du calcul LHC. Administrateurs de sites, experts calcul, et équipes du Centre de Calcul ont l’habitude de travailler en réseau. Le projet doit aussi aider à « exporter à l’international » le travail nourri en interne. Le bénéfice en retour est toujours important même si trop peu d’ingénieurs franchissent le pas en s’insérant par exemple au sein de groupes de travail WLCG, HEPix, EGI.

LCG-France a également noué avec RENATER et les équipes réseau de l’IN2P3 et du CEA, une collaboration déterminante. L’infrastructure LHCONE déployée fin 2011 permet aujourd’hui de distribuer à haut débit les données vers les sites régionaux (Tier-2/Tier-3) et ouvre de nouvelles possibilités de gestion du stockage et des données. C’est l’un des événements phares de l’année 2012.

Les différentes phases du projet

Après une phase de genèse des sites entre 2004 et 2008, la mise en production progressive de l’infrastructure a vu l’engagement des sites de l’IPHC, du CPPM et du LPSC en tant que Tier-2 de WLCG et a permis d’établir le calcul LHC en France à un niveau d’environ 10 % du calcul mondial.

Aujourd’hui, la composante Tier-1 du CC-IN2P3 assure le stockage sur bande d’une partie des données mondiales et participe aux campagnes de reconstruction. La petite dizaine de sites Tier-2/Tier-3 français a un rôle au moins aussi important, en contribuant à la simulation Monte Carlo et à l’analyse des données réduites et fournissant par-là, autant ou presque d’heures de calcul par an que le Centre de Calcul.

L’année 2012 a marqué un tournant faisant apparaître la nécessité de maitriser le coût opérationnel du calcul LHC. En effet, rien que le renouvellement des ressources (CPU, Disque, bandes) arrivant en fin de garantie a été estimé à près de 1,8 M€ par an. A la demande de la direction de l’IN2P3, un plan financier a été établi pour évaluer le support apporté par LCG-France, l’effort restant à la charge des sites. Cette démarche n’a cependant pas apporté toutes les réponses pour faire face à l’avenir.

10 ans bientôt et après…

La montée en puissance du LHC et la fin des projets européens qui ont soutenu le développement de l’infrastructure actuelle vont provoquer d’importants changements sinon des bouleversements à court ou moyen terme.

Peut-on réellement faire face à des besoins de calcul multipliés par 2 à l’horizon 2015 alors que le calcul devra dans le meilleur des cas fonctionner à budget constant ? Des optimisations sont possibles (achats informatiques, utilisation des ressources, performances des services et des logiciels, gestion des données…). Des opportunités existent (transition multithread/multicœur, reconversion temporaire des fermes HLT, utilisation de ressources extérieures HPC par ex…) et certaines évolutions technologiques annoncées sont prometteuses (Cloud, fédération de stockage, réseaux géographiques...). Bien évidemment, les modèles de calcul des expériences vont être révisés à la lumière de toutes ces possibilités. Mais entre nous, cela reste un sacré défi.

L’autre mutation annoncée concerne la couche de composants middleware qui permet d’intégrer l’ensemble des ressources distribuées au sein d’une seule et même infrastructure et qui assure aussi l’interface entre les environnements logiciels des expériences et les sites. Il faut évoluer vers une solution moins complexe, plus standard et un modèle de développement et de support collaboratif. N’oublions pas non plus que LCG-France dépend aujourd’hui du cœur opérationnel de l’infrastructure de production France Grilles. Il existe un certain nombre d’expertises et de services communs (sécurité, accounting, monitoring, helpdesk, autorité de certification) à toutes les communautés utilisatrices dont il faut impérativement assurer la pérennité à long terme.

En 2014, LCG-France fêtera ses 10 ans. Pour moi, l’épopée du projet reste motivante mais il faudra aussi savoir passer la main dans de bonnes conditions le moment venu.

Frédérique CHOLLET

n°24
Juillet
2013
La bande passante de RENATER largement occupée par les données du LHC

Fairouz Malek, responsable scientifique du projet LCG-France, l’a rappelé dans une interview publiée dans le rapport d’activité de RENATER : "Si le réseau n’est pas performant, rien ne se passe".

A consulter ce rapport, on peut en effet constater que les données du LHC occupent une très grande partie du réseau déployé par RENATER.

On peut par exemple y lire "En 2012, RENATER contribue activement à la mise en place de la partie française du réseau LHCONE (LHC Open Network Environment) destinée à transmettre rapidement les énormes masses de données générées par les expériences menées au CERN dans le cadre du projet Large Hadron Collider (LHC).

Réalisé en collaboration avec la communauté de la physique des particules (HEP/Large Hadron Collider Computing Grid), le réseau LHCONE permet de distribuer à très haut débit ces données aux sites participant aux expériences, en particulier le centre de calcul de premier niveau Tier1 de l’IN2P3 à Villeurbanne, et les centres de second niveau Tier2, comme le GRIF (Ile-de-France) ou Subatech (Nantes)."

Chose étonnante : en regardant de près la répartition du trafic, on s’aperçoit que celui-ci est presque aussi important sur les réseaux dédiés au LHC (LHCOPN + LHCONE, soit 21%) que sur le réseau IP généraliste (23%). Selon Jérôme Bernier, ingénieur réseau au CC-IN2P3, "Sachant que le trafic LHC doit aussi représenter une grosse partie du trafic sur le réseau généraliste, on doit pouvoir affirmer que le trafic LHC, c’est environ 2/3 du trafic de RENATER !".

Sur le sujet, voir aussi l’interview de Fairouz Malek page 15 du rapport d’activité de Renater : http://www.renater.fr/IMG/pdf/RAPPORT_RENATER-final_.pdf.

G.S.

n°24
Juillet
2013
12ème édition des Rencontres LCG-France

LCG-France organise traditionnellement deux rencontres par an au cours desquelles sont discutés l’état d’avancement du projet, l’évolution de l’infrastructure des sites et les activités de calcul des expériences LHC.

Du 28 au 30 mai derniers, la session du printemps 2013 s’est tenue à l’école polytechnique à Palaiseau, organisée localement par le LLR et en particulier avec l’aide très précieuse d’Andrea Sartirana. Elle a réuni au total sur les 3 jours, près de 70 participants.

Les enjeux pour la période de redémarrage du LHC après le 1er Long Shutdown (LS1) ont été évoqués par les orateurs de CMS et d’ATLAS. Comme chaque fois, la session réseau a permis de mesurer le chemin parcouru dans ce domaine. Le déploiement en France du LHCONE, réseau visant à fournir une connectivité très haut débit pour les communications entre les sites Tier1 et Tier2 est l’un des faits marquants de ces deux dernières années. Au fil des ans, la collaboration avec RENATER, l’implication des experts réseau du CC-IN2P3 et de l’Irfu (CEA) se sont révélées essentielles. L’amélioration de la connectivité a permis aux expériences de faire évoluer leurs modèles de calcul en remettant à plat le modèle strictement hiérarchique mis en place au départ. En effet, il est désormais possible d’optimiser le placement des données, d’adapter leur réplication aux besoins. Et plus de flexibilité dans la gestion des données permet une meilleure utilisation des ressources de stockage !

L’agenda riche, copieux et intense était à l’image des activités de la communauté LCG-France qui s’est associée à France-Grilles pour organiser les sessions très attendues sur le « cloud computing » et le « partage des tâches des opérations de l’infrastructure ». Ces deux sessions ont aussi servi à la communauté et aux sites impliqués sur LCG-France et sur France-Grilles à préparer une réflexion globale sur leurs futures collaborations et les moyens pour y parvenir. Ces questions sont à suivre donc !

Plus de détails sur l’agenda.

Lors de cette édition, nous avons pu constater combien il était nécessaire d’agrandir le champ de la communauté IN2P3, vers les expériences en astroparticules par exemple, et de les associer à nos travaux ainsi qu’aux réflexions sur les mises à jour des logiciels et les technologies de grille et du stockage. Nous avons, en particulier, assisté à une présentation sur HESS et CTA sur la grille et une autre sur les études du génome sur cloud que nous avons extrêmement appréciées.

Pour la 1ère fois, LCG-France a fêté l’anniversaire des 10 ans d’AMI (ami.in2p3.fr), l’unique logiciel 100% de l’IN2P3 au service du LHC et de l’expérience ATLAS. GRIF et LCG-France atteindront leur maturité décennale en 2014 !

D’ici là, la session d’automne se tiendra au mois de novembre au CC-IN2P3. L’aventure du computing LHC continue !

Fairouz MALEK

n°24
Juillet
2013
ADASS, du 20 sept. au 3 oct.

The Astronomical Data Analysis Software and Systems (ADASS) conference is held each year at a different hosting astronomical institution. The conference provides a forum for scientists and programmers concerned with algorithms, software and software systems employed in the acquisition, reduction, analysis, and dissemination of astronomical data. An important element of the program is to foster communication between developers and users with a range of expertise in the production and use of software and systems. The program consists of invited talks, contributed oral and display papers, tutorials, user group meetings and special interest group meetings (called BOFs).

The 23rd annual ADASS conference will be held in Waikoloa, Hawaii, USA, 29 Sept-3 Oct 2013.

More information at http://adass2013.cfht.hawaii.edu.

CHEP, du 14 au 18 octobre

La 20e édition de CHEP (Conference on Computing in High Energy and Nuclear Physics) se déroulera du 14 au 18 octobre prochains à Amsterdam.

Programme et inscriptions à l’adresse http://www.chep2013.org.

JRES, du 10 au 13 décembre

L’édition 2013 des JRES aura lieu au CORUM à Montpellier du 10 au 13 décembre 2013.

Depuis 1995, les Journées RESeaux (JRES) sont une référence pour les acteurs de l’enseignement supérieur et de la recherche en France. Organisées tous les deux ans dans une grande ville de métropole, elles proposent quatre journées de conférences sur les thématiques définies par le Comité de Programme des JRES, assorties d’une exposition des partenaires industriels et institutionnels. Elles réunissent les acteurs qui contribuent au déploiement et à l’essor des nouvelles technologies de l’information et de la communication dans les établissements d’enseignement supérieur et de recherche.

Plus d’informations à l’adresse https://www.jres.org.

n°24
Juillet
2013
CDD : Ingénieur Administration Stockage et Base de données

Le Centre de Calcul recherche pour le projet eTRIKS un ingénieur informaticien pour la mise en place et l’exploitation du système de Stockage et de Base de Données de la plateforme tranSMART de gestion de connaissance.

Profil détaillé et procédure de candidature.

CDD : Ingénieur Support aux utilisateurs et au projet eTRIKS

Le Centre de Calcul recherche pour le projet eTRIKS un ingénieur pour le support aux activités des utilisateurs et des projets utilisant la plateforme tranSMART déployée pour eTRIKS et à leur formation.

Profil détaillé et procédure de candidature.

CDD : Ingénieur Administrateur système Linux

Le Centre de Calcul recrute un Ingénieur Informaticien, administrateur système Linux, afin de déployer et de gérer le parc matériel de serveurs Linux.

Profil détaillé et procédure de candidature.