Interview de Julien Rault

Interview de Julien Rault, responsable des projets numériques de la bibliothèque de Sciences-Po. Il faisait partie de l'équipe chargée de renvoyer les données scientométriques à QS, avec Michel Gardette et Elise Chapoy.


1. Quelle a été votre méthodologie ?

Nous avons utilisé la base de données ESI –Essential Sciences Indicator- pour remplir les tableaux sur nos chercheurs. C’est la même base que Jiao Tong utilise. La société américaine Thomson possède l'énorme base de données ISI Web of Knowledge, dont le coût est d'environ 30 000 euros/an. ESI est une sous-base de données de ISI. ESI filtre les articles d’ISI et n'en prend que la crème, ceux qui sont le plus cités. Cela correspond à environ 1% d’ISI.


2. Quelle est la différence avec Scopus ?

Scopus regroupe ISI et y ajoute les actes de colloques. Ce ne sont pas des articles, mais les textes exposés durant un colloque.

Donc, QS network nous contacte et nous dit « vous devez faire une liste de vos chercheurs et dire combien de fois ils sont cité suivant la base ESI ». Nous avons cherché dans ESI : aucun n’est cité, même Bruno Latour qui publie pourtant en anglais.


3. Y a-t-il un contrôle ?

Normalement, il y a un contrôle a posteriori. Mais on n’en est pas sûr. Sciences Po est passé de la 52e à la 293e position. L’année où Sciences Po était 52e, nous n’avons pas transmis de données, car ce n’était pas obligatoire. Cette année, c’est devenu obligatoire de le remplir.

Le THES demande d'autres informations comme le nombre de livres et de périodiques achetés par an. En 2007 on est à 1,4 millions d’euros par an. Le THES mesurait aussi la superficie, le nombre de personnes par élèves... Et là dedans, Sciences Po est très fort.

Avant, la recherche était mise de côté, et maintenant, boum. On est désavantagé, car en sciences sociales, on écrit plus de livres et bien souvent en français. D’ailleurs, est ce absurde d'écrire un livre sur la politique française en français ?


4. Qu’est-ce que la scientométrie ?

La scientométrie, plus précisément la bibliométrie est la mesure de l'impact d'un article ou d'un ouvrage. On définie cet impact en mesurant le nombre de citations. C’est dur à calculer. A la fin d'un article, il y a les références à d'autres ouvrages écrits précédemment. Pour mesure l'impact d'un article, il faudra compter tous les ouvrages qui vont, dans le futur, citer cet article. Il faut disposer d'outils pour analyser ces citations et d'un corpus conséquent. Les éditeurs ont inventé « Cross Ref » : c'est une association qui leur est réservée. Cross Ref récupère les données de tous les éditeurs dans une seule base de données. Ils utilisent une sorte d'handle, un lien pérenne qui redirige vers l'article en ligne. C'est le DOI: Digital Object Identifier, un identifiant unique pour chaque article. Il n’y a que les éditeurs qui peuvent attribuer des DOI. Les éditeurs sont très malins, avec ce DOI, ils rabattent les internautes souhaitant lire un article en ligne vers leur propre site internet payant alors que l'internaute est peut être déjà abonné à un autre bouquet de bases de données qui comprend cet article.


5. Comment avoir accès à ISI ?

ISI est la plus grosse base de données commerciale. Scopus contient ISI et d’autres documents. Comment Scopus fait pour avoir les ressources d’ISI ? Il doivent les payer. ISI coûte 30 000 euros /an.

Avec le DOI, le calcule du chemin inverse des références est facilité. Un système doit "lire" chaque article pour "reconnaître" les références pour les substituer par leur DOI, l'identifiant non ambigu. Au bout d'un moment, les articles que l'on avait analysé se retrouvent eux-mêmes cités. Problème : le périmètre de cette base, c’est ISI. Pour qu'une citation compte, il faut que l'article référant et l'article cité soit dans ISI. Et ISI n’a presque pas de sciences humaines, encore moins les revues françaises et pas de livres. ISI ne contient pas l'intégralité de la production de nos chercheurs et de leurs confrères qui les citent.


6. Comment remédier au problème d’exhaustivité d’ISI et Scopus ?

La seule base suffisamment large pour contenir de nombreux ouvrages en langues françaises, c’est Google Scholar. D’ailleurs, si on y jette un œil, on voit que de nombreux chercheurs de Sciences Po y apparaissent alors qu'ils sont inconnu d'ISI. En plus, quand on va sur Google scholar, et qu’on clique sur un des auteurs, leurs livres en français sont bien présents. On peut même lire ces ouvrages gratuitement, mais c'est un autre sujet.

Il faut un véritable moteur de recherche capable de prendre en compte l’intégralité des bases de données. Seul un acteur comme Google pourra avoir une vision macroscopique de la recherche mondiale. Il permettra de donner la voix aux sciences sociales, qui sont étouffées par les sciences dures.

Il existe d’autres indicateurs bibliométrique d’ailleurs. « L’impact factor » : c’est une moyenne de citations dans les revues. Il faut 3 ans pour avoir un véritable retour. Il faut au minimum 3 ans, quand on écrit un article, pour qu’on soit vraiment cité. Ce temps est encore plus grand en sciences sociales. Ces impacts factor sont donnés chaque année. Ça doit être Thomson qui le fait.

http://eigenfactor.org/: c’est petite base de données, qui a 15 000 revues. Ils ont trouvé d’autres indicateurs de scientométrie : l’ « article influence ».


7. Google Scholar est-il la meilleure des solutions ?

Il y a mieux dans le futur. Jussieu, Paris VI-VII, paie environ 750 000 euros par an pour avoir accès aux bases de données dont ses chercheurs et ses étudiants ont besoin. Sciences Po paie 160 000 euros par an d’abonnement aux bases de données. Dès qu’on ne paie plus, tout s’arrête. Le plus gros éditeur de sciences, c’est Elsevier, qui a les 1200 revues les plus importantes. Il a augmenté ses prix de 20% cette année, alors qu’il a engrangé 30% de bénéfices annuels.

Un mouvement est né : les « archives ouvertes », avec les déclarations de Budapest en 2001 et Berlin en 2003. Ce mouvement vise à contre balancer le poids des éditeurs. La recherche publique est financée par de l'argent public. Ces recherches aboutissent à des résultats de recherche sous forme de livres, d'articles. Dans l'économie de la connaissance, on appelle ces publications le savoir ouvert. Le but des Archives Ouvertes est de rendre libre l’accès à ce savoir ouvert. Si chaque université dépose sur son site ses résultats de recherche, nous disposerons de l'intégralté des publications et ce, gratuitement.

Sciences-Po a créé SPIRE (Sciences Po Institutional REpository) : http://spire.sciences-po.fr/ C’est notre Archive Ouverte. Cela a été créé pour un projet européen, Nereus NEEO. Il n’y a pour l'instant que les économistes dedans. Nous allons l'ouvrir à l'ensemble des champs de recherche.


8. Qui est intéressé par l’open archive ?

Les jeunes doctorants

Les pays pauvres qui n’ont pas accès aux résultats de la recherche scientifique des pays riches.

Les industriels, surtout les PME, qui n’ont pas les moyens de s’abonner aux revues de leur milieu, ce qui limite leur potentiel d’innovation, alors qu’il ont participer indirectement au financement de la recherche publiques.

Les bibliothèques universitaires, qui payent une fortune pour accéder aux publications de leurs propres chercheurs.

Quelques links sur ce mouvement :

http://www.ext.upmc.fr/urfist/archives-ouvertes.htm

http://www.openarchives.org

http://wiki.sciences-po.fr/mediawiki/index.php/Spire


9. Qu'en est-il du h-index ?

http://en.wikipedia.org/wiki/Hirsch_number : le h-index est un indicateur créé par Jorge E. Hirsch. C’est une sorte d’impact factor par chercheur. Par une formule mathématique, et à l'aide d'un corpus comme ISI, Scopus ou Google Scholar on calcule le nombre de publications et le nombre de fois où elles ont été citées. On obtient ainsi une sorte de moyenne de citations par article publié. C’est assez juste, les prix Nobel avait tous un très fort h-index. C’est une solution pour avoir un indicateur par chercheur. Cette formule pourra s'appliquer sur le corpus des archives ouverte. L'indicateur, pour une université, pourrait être la somme des h-index de ses chercheurs.


10. Sciences-Po est-elle une marque ?

On a un problème aux niveaux des articles scientifiques de Sciences Po. Les chercheurs signent : FNSP, Fondation Nationale des Sciences Politiques, IEP, Institut d’Etudes Politiques de Paris, ou alors, ils signaient selon les différents centres de recherche (UMR) qui ne font pas apparaître l'affiliation à Sciences Po.

Sciences Po est une marque déposée à l’INPI – Institut national de la propriété industrielle, mais n’a pas d’existance en temps que personne morale comme l’IEP ou la FNSP.

La nouvelle marque devrait servir à unifier tout ça. C’est une question politique à régler. Les libellés des affiliations doivent être constants à la virgule prêt. C’est une très précieuse clé de recherche dans les bases de données. Cela pourrait ressembler à Sciences Po - CEVIPOF, Sciences Po - CERI, Sciences Po - OFCE...

Remarque : il serait intéressant de comparer Sciences-Po à la LSE qui elle aussi a perdu 100 places dans le classement THES cette année, et qui est aussi dans les sciences sociales/humaines.


11. Pourquoi les sciences humaines intéressent moins que les sciences humaines ?

Peut être parce qu'il y a moins d'argent en jeu. Une découverte en sciences dures peut être rapidement transformée en un produit commercialisable. Une découverte en sciences sociales va prendre plus de temps à s'imposer et la mesure de sa rentabilité sera bien plus complexe à mesurer.

Cependant, il existe une interface qu’il serait intéressant d’explorer : les liens entre informatique et sciences sociales. Cf le data mining comme les super marchés le font. Exemple : Mr Vélib engage un sociologue informaticien pour qu’il fasse une étude : qui prend les vélibs ? Où ? etc, pour mieux savoir où mettre ses bornes.


12. L’impact des universités dans les médias serait un critère intéressant ?

Il existe plusieurs types de productions scientifiques :

Les articles en peer review : avec comité de lecture de scientifiques qui se réunissent, lisent l’article ensembles, et voient s’ils le publient ou non.

Les articles sans peer review : sans comité de lecture, c’est l’éditeur (qui n’est pas spécialiste) qui décide de le publier.

Les working papers ou « pre-print » : les documents de travail, diffusés dans les laboratoires avant d’être publiés.

Les actes de colloques ou « proceeding » : ceux qui sont diffusés dans Scopus, mais pas dans ISI.

Les articles de journaux ou « news items » : dans Le monde, Le point, etc… pas scientifiques.

La télé : par exemple, quand les scientifiques du CEVIPOF s’exprime à la télé en période d’élections. Ce n’est pas mesuré. Ni même le buzz autour des ZEP, alors que ça a de l’impact sur la notoriété de Sciences-Po.

Les livres : pas pris en compte dans les bases de données.

Les expositions

Tout devrait compter. Mais comment le quantifier, le barycentrer ?


13. Qu’est-ce sont les revues de type A ?

Ce sont les revues de niveau international à comité de lecture (peer review). Elles sont presque toutes en anglais. Notre problème à Sciences-Po, c’est que l’on publie beaucoup en français, et en livres.


14. Conclusion

ll faut peut être réorienter nos pratiques d'édition scientifique, imposer la marque Sciences Po dans les affiliations, mettre en place les Archives Ouvertes de Sciences Po, accumuler et comparer les indices de scientométrie, imposer d'utiliser les indices qui nous représentent le mieux.