La cartographie du web est un procédé de mise en évidence des réseaux basée sur les World Wide Web. Cela consiste à établir identifier les sites internet pertinents par rapport à notre controverse et les relations qu’ils entretiennent entre eux, via les liens hypertextes des uns vers les autres. Le résultat est une « carte » du web, ou les sites sont représentés par un point (dont la taille dépend du nombre de liens vers et venant de ce site), et des liens qu’ils tirent entre eux (la courbe du lien indique dans quel sens il va) Pour réaliser cette carte, nous avons utilisé Navicrawler, un module pour Firefox qui permet d’automatiser la navigation et la recherche des liens. Sur les sites qui le permettaient (c’est-à-dire pas trop gros), le logiciel a donc visité la majorité des pages et indexé les liens qu’il y trouvait. Cette méthode permet à la fois de trouver de nouveaux sites pertinents pour notre controverse et de tisser les liens qui apparaissent plus tard sur la carte. Nous avons ainsi répertorié un peu plus de 4000 sites. Par contrainte de temps, nous sommes limités à en visiter 700 ; parmi ceux-là, nous avons recherché (avec la recherche intégrée ou la recherche google par domaine, et grâce à la description / « about us ») ceux qui se joignaient à notre controverse. Le catalogue final comprend 89 noms de domaines différents, catégorisés selon trois types de classement (type de site, langue, type d’acteur). La deuxième étape passe par le logiciel Gephi, auquel on fournit les données récupérées par le Navicrawler (sites sélectionnés et liens entre eux), et qui les place sur une carte. Il permet ensuite de rendre la carte lisible, en calculant la position des points selon les liens qui les relient, en rendant la taille des points proportionnels au nombre de liens et en donnant une couleur à chaque catégorie. De manière générale, l’intérêt de la cartographie du web est de permettre une représentation « objective » du réseau d’acteurs de la controverse, où il faut tenir compte du biais des communautés web. Dans notre cas, il était important d’avoir le point de vue de la société et sa culture sur les raisons de l’existence de l’orgasme féminin. Car bien qu’il puisse s’agir d’une controverse très scientifique, c’est aussi un sujet qui touche et intéresse beaucoup de femmes et d’individus. Cartographier le web permet d’observer les positions des scientifiques, des féministes, etc. mais surtout du grand public, via ses réactions, les médias qui s’adressent à lui. Le premier problème qui se présente pour tenter de cartographier une controverse portant sur l’orgasme féminin est assez évident, il s’agit de la pornographie. Malgré les précautions simples pour l’éviter, il est toujours étonnant de voir remonter un site érotique pour des requêtes dont tous les termes à part « orgasme » sont scientifiques (en marge des sites pornographiques, on trouve tout de même la littérature érotique, dont la position sur l’orgasme est plus facilement interprétable et intéressante). Les deux autres sources de « parasites » sont très proches : d’un côté des conseils de sexualité pure, qui ne s’attardent pas sur une signification ou une fonction de l’orgasme ; de l’autre, différents points de vue dans la controverse autour du point G, beaucoup plus active que la nôtre, probablement parce qu’ayant des applications pratiques immédiates pour l’internaute lambda. Ces deux sujets sont beaucoup plus difficiles à éviter que la pornographie, puisque les débats sur l’orgasme y sont bien souvent plongés. Ajouté à une relative rareté du débat sur le web autour de notre sujet, ce furent les principaux obstacles à cette cartographie du web. Une dernière difficulté fut peut-être la nécessité d’aller chercher au-delà des simples « reviews » du livre d’Elizabeth Lloyd, The case of the Female Orgasm, qui défraye la chronique sur le web plus que tous les autres éléments de la controverse. Afin de compléter les résultats obtenus dans la cartographie du web (qui sont limités à l’intérieur de la communauté scientifique), nous avons réalisé une cartographie scientométrique des principaux articles de recherche participant à notre controverse (vous pouvez les retrouver dans la chronologie, où nous présentons la thèse présentée par l’article). Il s’agissait d’établir comment les citations de ces articles les lient les uns aux autres, et quels sont les articles qui ont de l’influence dans les mêmes communautés de chercheurs. Nous avons pour cela utilisé une la fonction Heuristiques du Navicrawler. Une fois réglé, celui-ci récupère dans Google Scholar les papiers qui citent l’article étudié. Nous avons répété cette procédure pour la douzaine d’articles sélectionnés : chercher sa référence dans Google Scholar, puis parcourir l’ensemble des pages d’articles qui y font références. Ces données sont ensuite traitées dans Gephi de la même manière que pour la cartographie du web. Au total, et en limitant strictement notre sélection aux articles initiaux, nous avons récupéré un peu plus de 4 000 papiers différents, dont une très grande part d’importance mineure (cités 1 ou 2 fois par d’autres chercheurs). Cela pose déjà un problème technique, puisqu’avec nos moyens informatiques, il n’est pas possible de spatialiser (rendre le graphe lisible en replaçant les points) un graphique de plusieurs milliers de points. Nous avons donc éliminé les nœuds qui ne citaient qu’un seul de nos articles, pour ne garder que ceux qui pouvaient « faire le lien » entre deux de nos articles en les citant tous les deux. On perd ainsi une mesure de l’influence qu’ont ces articles dans la communauté (le nombre de citations) ; nous avons compensé en intégrant le h-index, un indice d’impact/productivité par auteur, et en rendant la taille des nœuds proportionnelle à cette mesure. L’autre problème de ce grand nombre de résultats est qu’il requiert de parcourir plusieurs centaines de pages Google, ce qui amène celui-ci à détecter une navigation automatisée et à bloquer l’adresse IP de notre poste. Problème que nous avons contourné en passant par un serveur proxy pour envoyer les requêtes. Parmi les autres choix que nous avons dû faire, il y eut celui de devoir se limiter à un article par auteur, par souci de clarté dans le schéma et par contrainte de temps. Nous avons aussi choisi de ne pas étendre la sélection première, sous peine de se retrouver rapidement avec plusieurs centaines d’articles (et les citations qui vont avec) à étudier. Nous présentons ici les travaux majeurs de notre controverse, ainsi que des articles emblématiques des théories en présence.