Interview de Julien Rault, responsable
des projets numériques de la bibliothèque de
Sciences-Po. Il faisait partie de l'équipe chargée de
renvoyer les données scientométriques à QS, avec
Michel Gardette et Elise Chapoy.
1. Quelle a été votre
méthodologie ?
Nous avons utilisé la base de
données ESI –Essential Sciences Indicator- pour remplir les
tableaux sur nos chercheurs. C’est la même base que Jiao Tong
utilise. La société américaine Thomson possède
l'énorme base de données ISI Web of Knowledge, dont le
coût est d'environ 30 000 euros/an. ESI est une sous-base de
données de ISI. ESI filtre les articles d’ISI et n'en prend
que la crème, ceux qui sont le plus cités. Cela
correspond à environ 1% d’ISI.
2. Quelle est la différence avec
Scopus ?
Scopus regroupe ISI et y ajoute les
actes de colloques. Ce ne sont pas des articles, mais les textes
exposés durant un colloque.
Donc, QS network nous contacte et nous
dit « vous devez faire une liste de vos chercheurs et dire
combien de fois ils sont cité suivant la base ESI ».
Nous avons cherché dans ESI : aucun n’est cité, même
Bruno Latour qui publie pourtant en anglais.
3. Y a-t-il un contrôle ?
Normalement, il y a un contrôle a
posteriori. Mais on n’en est pas sûr. Sciences Po est passé
de la 52e à la 293e position. L’année où
Sciences Po était 52e, nous n’avons pas transmis de données,
car ce n’était pas obligatoire. Cette année, c’est
devenu obligatoire de le remplir.
Le THES demande d'autres informations
comme le nombre de livres et de périodiques achetés par
an. En 2007 on est à 1,4 millions d’euros par an. Le THES
mesurait aussi la superficie, le nombre de personnes par élèves...
Et là dedans, Sciences Po est très fort.
Avant, la recherche était mise
de côté, et maintenant, boum. On est désavantagé,
car en sciences sociales, on écrit plus de livres et bien
souvent en français. D’ailleurs, est ce absurde d'écrire
un livre sur la politique française en français ?
4. Qu’est-ce que la scientométrie
?
La scientométrie, plus
précisément la bibliométrie est la mesure de
l'impact d'un article ou d'un ouvrage. On définie cet impact
en mesurant le nombre de citations. C’est dur à calculer. A
la fin d'un article, il y a les références à
d'autres ouvrages écrits précédemment. Pour
mesure l'impact d'un article, il faudra compter tous les ouvrages qui
vont, dans le futur, citer cet article. Il faut disposer d'outils
pour analyser ces citations et d'un corpus conséquent. Les
éditeurs ont inventé « Cross Ref » : c'est
une association qui leur est réservée. Cross Ref
récupère les données de tous les éditeurs
dans une seule base de données. Ils utilisent une sorte
d'handle, un lien pérenne qui redirige vers l'article en
ligne. C'est le DOI: Digital Object Identifier, un identifiant unique
pour chaque article. Il n’y a que les éditeurs qui peuvent
attribuer des DOI. Les éditeurs sont très malins, avec
ce DOI, ils rabattent les internautes souhaitant lire un article en
ligne vers leur propre site internet payant alors que l'internaute
est peut être déjà abonné à un
autre bouquet de bases de données qui comprend cet article.
5. Comment avoir accès à
ISI ?
ISI est la plus grosse base de données
commerciale. Scopus contient ISI et d’autres documents. Comment
Scopus fait pour avoir les ressources d’ISI ? Il doivent les payer.
ISI coûte 30 000 euros /an.
Avec le DOI, le calcule du chemin
inverse des références est facilité. Un système
doit "lire" chaque article pour "reconnaître"
les références pour les substituer par leur DOI,
l'identifiant non ambigu. Au bout d'un moment, les articles que l'on
avait analysé se retrouvent eux-mêmes cités.
Problème : le périmètre de cette base, c’est
ISI. Pour qu'une citation compte, il faut que l'article référant
et l'article cité soit dans ISI. Et ISI n’a presque pas de
sciences humaines, encore moins les revues françaises et pas
de livres. ISI ne contient pas l'intégralité de la
production de nos chercheurs et de leurs confrères qui les
citent.
6. Comment remédier au problème
d’exhaustivité d’ISI et Scopus ?
La seule base suffisamment large pour
contenir de nombreux ouvrages en langues françaises, c’est
Google Scholar. D’ailleurs, si on y jette un œil, on voit que de
nombreux chercheurs de Sciences Po y apparaissent alors qu'ils sont
inconnu d'ISI. En plus, quand on va sur Google scholar, et qu’on
clique sur un des auteurs, leurs livres en français sont bien
présents. On peut même lire ces ouvrages gratuitement,
mais c'est un autre sujet.
Il faut un véritable moteur de
recherche capable de prendre en compte l’intégralité
des bases de données. Seul un acteur comme Google pourra avoir
une vision macroscopique de la recherche mondiale. Il permettra de
donner la voix aux sciences sociales, qui sont étouffées
par les sciences dures.
Il existe d’autres indicateurs
bibliométrique d’ailleurs. « L’impact factor »
: c’est une moyenne de citations dans les revues. Il faut 3 ans
pour avoir un véritable retour. Il faut au minimum 3 ans,
quand on écrit un article, pour qu’on soit vraiment cité.
Ce temps est encore plus grand en sciences sociales. Ces impacts
factor sont donnés chaque année. Ça doit être
Thomson qui le fait.
http://eigenfactor.org/: c’est petite
base de données, qui a 15 000 revues. Ils ont trouvé
d’autres indicateurs de scientométrie : l’ « article
influence ».
7. Google Scholar est-il la meilleure
des solutions ?
Il y a mieux dans le futur. Jussieu,
Paris VI-VII, paie environ 750 000 euros par an pour avoir accès
aux bases de données dont ses chercheurs et ses étudiants
ont besoin. Sciences Po paie 160 000 euros par an d’abonnement aux
bases de données. Dès qu’on ne paie plus, tout
s’arrête. Le plus gros éditeur de sciences, c’est
Elsevier, qui a les 1200 revues les plus importantes. Il a augmenté
ses prix de 20% cette année, alors qu’il a engrangé
30% de bénéfices annuels.
Un mouvement est né : les «
archives ouvertes », avec les déclarations de Budapest
en 2001 et Berlin en 2003. Ce mouvement vise à contre balancer
le poids des éditeurs. La recherche publique est financée
par de l'argent public. Ces recherches aboutissent à des
résultats de recherche sous forme de livres, d'articles. Dans
l'économie de la connaissance, on appelle ces publications le
savoir ouvert. Le but des Archives Ouvertes est de rendre libre
l’accès à ce savoir ouvert. Si chaque université
dépose sur son site ses résultats de recherche, nous
disposerons de l'intégralté des publications et ce,
gratuitement.
Sciences-Po a créé SPIRE
(Sciences Po Institutional REpository) : http://spire.sciences-po.fr/
C’est notre Archive Ouverte. Cela a été créé
pour un projet européen, Nereus NEEO. Il n’y a pour
l'instant que les économistes dedans. Nous allons l'ouvrir à
l'ensemble des champs de recherche.
8. Qui est intéressé par
l’open archive ?
Les jeunes doctorants
Les pays pauvres qui n’ont pas accès
aux résultats de la recherche scientifique des pays riches.
Les industriels, surtout les PME, qui
n’ont pas les moyens de s’abonner aux revues de leur milieu, ce
qui limite leur potentiel d’innovation, alors qu’il ont
participer indirectement au financement de la recherche publiques.
Les bibliothèques
universitaires, qui payent une fortune pour accéder aux
publications de leurs propres chercheurs.
Quelques links sur ce mouvement :
http://www.ext.upmc.fr/urfist/archives-ouvertes.htm
http://www.openarchives.org
http://wiki.sciences-po.fr/mediawiki/index.php/Spire
9. Qu'en est-il du h-index ?
http://en.wikipedia.org/wiki/Hirsch_number
: le h-index est un indicateur créé par Jorge E.
Hirsch. C’est une sorte d’impact factor par chercheur. Par une
formule mathématique, et à l'aide d'un corpus comme
ISI, Scopus ou Google Scholar on calcule le nombre de publications et
le nombre de fois où elles ont été citées.
On obtient ainsi une sorte de moyenne de citations par article
publié. C’est assez juste, les prix Nobel avait tous un très
fort h-index. C’est une solution pour avoir un indicateur par
chercheur. Cette formule pourra s'appliquer sur le corpus des
archives ouverte. L'indicateur, pour une université, pourrait
être la somme des h-index de ses chercheurs.
10. Sciences-Po est-elle une marque ?
On a un problème aux niveaux des
articles scientifiques de Sciences Po. Les chercheurs signent : FNSP,
Fondation Nationale des Sciences Politiques, IEP, Institut d’Etudes
Politiques de Paris, ou alors, ils signaient selon les différents
centres de recherche (UMR) qui ne font pas apparaître
l'affiliation à Sciences Po.
Sciences Po est une marque déposée
à l’INPI – Institut national de la propriété
industrielle, mais n’a pas d’existance en temps que personne
morale comme l’IEP ou la FNSP.
La nouvelle marque devrait servir à
unifier tout ça. C’est une question politique à
régler. Les libellés des affiliations doivent être
constants à la virgule prêt. C’est une très
précieuse clé de recherche dans les bases de données.
Cela pourrait ressembler à Sciences Po - CEVIPOF, Sciences Po
- CERI, Sciences Po - OFCE...
Remarque : il serait intéressant
de comparer Sciences-Po à la LSE qui elle aussi a perdu 100
places dans le classement THES cette année, et qui est aussi
dans les sciences sociales/humaines.
11. Pourquoi les sciences humaines
intéressent moins que les sciences humaines ?
Peut être parce qu'il y a moins
d'argent en jeu. Une découverte en sciences dures peut être
rapidement transformée en un produit commercialisable. Une
découverte en sciences sociales va prendre plus de temps à
s'imposer et la mesure de sa rentabilité sera bien plus
complexe à mesurer.
Cependant, il existe une interface
qu’il serait intéressant d’explorer : les liens entre
informatique et sciences sociales. Cf le data mining comme les super
marchés le font. Exemple : Mr Vélib engage un
sociologue informaticien pour qu’il fasse une étude : qui
prend les vélibs ? Où ? etc, pour mieux savoir où
mettre ses bornes.
12. L’impact des universités
dans les médias serait un critère intéressant ?
Il existe plusieurs types de
productions scientifiques :
Les articles en peer review : avec
comité de lecture de scientifiques qui se réunissent,
lisent l’article ensembles, et voient s’ils le publient ou non.
Les articles sans peer review : sans
comité de lecture, c’est l’éditeur (qui n’est pas
spécialiste) qui décide de le publier.
Les working papers ou «
pre-print » : les documents de travail, diffusés dans
les laboratoires avant d’être publiés.
Les actes de colloques ou «
proceeding » : ceux qui sont diffusés dans Scopus, mais
pas dans ISI.
Les articles de journaux ou «
news items » : dans Le monde, Le point, etc… pas
scientifiques.
La télé : par exemple,
quand les scientifiques du CEVIPOF s’exprime à la télé
en période d’élections. Ce n’est pas mesuré.
Ni même le buzz autour des ZEP, alors que ça a de
l’impact sur la notoriété de Sciences-Po.
Les livres : pas pris en compte dans
les bases de données.
Les expositions
Tout devrait compter. Mais comment le
quantifier, le barycentrer ?
13. Qu’est-ce sont les revues de type
A ?
Ce sont les revues de niveau
international à comité de lecture (peer review). Elles
sont presque toutes en anglais. Notre problème à
Sciences-Po, c’est que l’on publie beaucoup en français,
et en livres.
14. Conclusion
ll faut peut être réorienter
nos pratiques d'édition scientifique, imposer la marque
Sciences Po dans les affiliations, mettre en place les Archives
Ouvertes de Sciences Po, accumuler et comparer les indices de
scientométrie, imposer d'utiliser les indices qui nous
représentent le mieux.
|