Disposer d’un espace où les données circuleront librement.

14 octobre 2005

Directeur de recherche à l’INRIA (Institut National de Recherche en Informatique et en Automatique), Laurent Romary s’est vu confié en juillet dernier la Direction de l’Information Scientifique (DIS), direction nouvellement créée au sein du CNRS pour favoriser la mise en œuvre d’une politique coordonnée pour l’information scientifique et technique. Perspectives...

Question : Vous vous êtes vu confié au mois de juillet dernier la direction de l’information scientifique. Quels sont aujourd’hui vos chantiers prioritaires ?

Laurent Romary : Lorsque l’on parle d’information scientifique, il est nécessaire de prendre en compte l’IST au sens large et non pas uniquement les questions liées aux publications. La volonté d’améliorer la diffusion de l’ensemble de la production des chercheurs - publications et données primaires (cahiers d’expérience, données statistiques, documents photo ou multimédia) - est au cœur de la démarche qui a conduit à la mise en place de la DIS.
Ensuite, il faut se donner les moyens de favoriser la diffusion de l’ensemble de ces données tant en amont de la publication, comme pour ArXiv, que de manière synchronisée, publications et données primaires, comme c’est le cas dans le domaine de la recherche médicale.

Q. : Qu’en est-il justement aujourd’hui des données non textuelles ou primaires, essentielles dans de nombreuses disciplines ?

L. R. : Je distinguerai ici deux axes. Le premier, qui consiste à identifier les données primaires et à effectuer un « moissonnage » des métadonnées   pour l’ensemble de ces matériaux.
Le second consiste à numériser de manière accrue et normalisée des données et documents qui, à ce jour, ne sont pas encore disponibles sous forme numérique. C’est dans ce sens que se mettent en place les centres de compétence : rassembler les compétences humaines et technologiques pour offrir à tous les laboratoires le même niveau de service d’accès à l’information tout en disposant d’une stratégie adaptée aux différentes disciplines.

Q. : Qu’en est-il de la coopération avec les autres EPST et les universités concernant l’alimentation et l’accès aux archives ? L’interopérabilité   est-elle la règle ?

L. R. : Les données factuelles sont par essence très thématiques, intimement liées au domaine concerné. Elles ne nécessitent donc pas la mise en place de grosses coopérations inter-établissements. Il n’en va pas de même pour les publications ou les bases de données où seule une coopération nationale permet d’avoir une vision d’ensemble. Nous n’envisageons pas pour l’heure de développements technologiques mais bien plutôt une contribution politique pour s’acheminer vers une base unique des publications. L’essentiel des laboratoires du CNRS sont des unités mixtes, qui fonctionnent en association avec d’autres organismes de recherche ou d’enseignement supérieur. C’est donc avec l’ensemble de ces acteurs que nous travaillons actuellement.
Aujourd’hui, nous sommes près d’un accord avec l’INRA, l’Inserm, l’INRIA et les universités. Durant les deux prochaines années, nous expérimenterons une gestion administrative et technique commune d’une archive des publications.

Q. : Plusieurs études réalisées Outre-Atlantique et en Europe montrent que l’implication des chercheurs est essentielle pour le développement des archives ouvertes. Des actions spécifiques sont-elles envisagées au niveau du CNRS ?

L. R. : Il est évident que le chercheur doit être au centre du dispositif d’archivage  . Dans le cas de l’archive institutionnelle  , qui reposera sur HAL [1], les chercheurs disposeront d’une interface de saisie qu’ils seront amenés à renseigner directement lors du dépôt de leurs articles. Le principal contre-argument consiste à dire que cela ajoutera une tâche administrative supplémentaire et que c’est là le principal frein au développement des archives.
Il n’est pas question que cela se fasse sans l’intervention du chercheur en créant un service dont la mission consisterait à alimenter l’archive. Actuellement, tous les chercheurs se livrent déjà à ce type d’exercices : au moment de l’évaluation, lors de réponses à des appels d’offre ou pour actualiser leur bibliographie sur leurs pages web personnelles.
Plusieurs mesures d’accompagnement sont d’ailleurs prévues pour inciter les chercheurs : tout un panel d’outils et de services sera mis à disposition pour faciliter leur recherche. A titre d’exemple, il ne leur sera plus nécessaire de fournir de listes de publications : celles-ci seront directement extraites de l’archive.

Q. : Les conseils de la recherche britannique ont récemment proposé de conditionner l’obtention de financements publics à une obligation d’archivage. Une proposition qui figurait déjà parmi les recommandations de l’OCDE (déclaration de janvier 2004). De telles dispositions pourraient-elles être envisagées en France ?

L. R. : Petit à petit, probablement. Mais aller trop vite, sans tenir compte des spécificités et par des mesures contraignantes, n’est pas souhaitable. On ne peut pas demander à l’ensemble des chercheurs de se convertir brutalement à l’auto-archivage  . Pour ce qui est des données primaires la situation est quelque peu différente. La pression peut être plus forte qu’avec les publications : il n’y a pas de précaution particulière à prendre puisque ces données échappent au circuit de l’édition.
C’est pour ces raisons que le CNRS a privilégié une combinaison entre archive ouverte   et archive institutionnelle ainsi qu’une démarche forte de partenariats avec l’ensemble des institutions pour parvenir à un dépôt systématique. Après, en fonction des disciplines et thématiques, les données seront ouvertes à la libre consultation ou cachées pour des raisons de confidentialité.
La démarche change mais notre objectif est le même que celui d’un Stevan Harnad : disposer à terme d’un espace où les données issues de la recherche circuleront librement.

[1Le logiciel HAL (hyper article en ligne) fournit une interface permettant aux auteurs de déposer sur la base du Centre pour la Communication scientifique Directe du CNRS (CCSD/CNRS) des manuscrits d’articles scientifiques dans toutes les disciplines.