Indice h
L'indice h (ou indice de Hirsch ou h-index en anglais) est un indice ayant pour but de quantifier la productivité scientifique et l'impact d'un scientifique en fonction du niveau de citation de ses publications. En résumé, un chercheur avec un indice de h a publié h articles qui ont été cités au moins h fois. Cet indice peut aussi s'appliquer à un groupe de scientifiques, tel qu'un département, une université ou un pays. Cet indice appartient à l'ensemble des métriques du niveau d'un auteur (en).
L'indice a Ă©tĂ© suggĂ©rĂ© en 2005 par Jorge Hirsch comme un outil pour dĂ©terminer une qualitĂ© relative des physiciens thĂ©oriciens, cette mesure pouvant ĂȘtre Ă©tendue Ă tous les chercheurs publiant dans des revues Ă comitĂ© de lecture[1]. Hirsch suggĂšre que, pour les physiciens, une valeur de 10-12 devrait permettre de considĂ©rer un poste de chercheur rĂ©sidant dans une universitĂ© renommĂ©e. Un poste de professeur pourrait ĂȘtre considĂ©rĂ© Ă partir de 18, et 15-20 pour la qualitĂ© de membre de la SociĂ©tĂ© amĂ©ricaine de physique. Une valeur supĂ©rieure Ă 45 pointerait vers la possibilitĂ© d'ĂȘtre admis Ă l'AcadĂ©mie nationale des sciences[2]. En janvier 2020 Jorge Hirsch revint cependant sur cette idĂ©e : « J'ai proposĂ© l'index H en espĂ©rant qu'il serait une mesure objective d'accomplissement scientifique. Dans l'ensemble, je pense que cela est considĂ©rĂ© comme Ă©tant le cas. Mais Ă prĂ©sent, j'en suis venu Ă croire qu'il [l'index H] peut aussi Ă©chouer spectaculairement et avoir de sĂ©vĂšres consĂ©quences nĂ©gatives involontaires. Je peux comprendre ce quâa dĂ» ressentir l'apprenti sorcier[3]. »
DĂ©finition et mesure
L'indice est fondé sur la distribution des citations dont fait l'objet le travail d'un chercheur. D'aprÚs Hirsch : « Un scientifique a un indice h si h de [ses] Np articles ont chacun au moins h citations, et les autres (Np - h) articles ont au plus h citations chacun. »
Autrement dit, un chercheur avec un indice de h a publiĂ© h articles qui ont Ă©tĂ© citĂ©s au moins h fois[4]. DĂšs lors, l'indice h reflĂšte Ă la fois le nombre de publications et le nombre de citations par publication. L'indice permet d'aller plus loin que la simple mesure du nombre d'articles ou de citations, tout en ne permettant qu'une comparaison des chercheurs Ă l'intĂ©rieur d'un mĂȘme champ (les conventions de citation pouvant varier). En physique, un chercheur de niveau moyen devrait avoir un Ă peu prĂšs Ă©quivalent Ă la durĂ©e de sa carriĂšre, tandis que pour les chercheurs en sciences biologiques et biomĂ©dicales cette valeur est gĂ©nĂ©ralement plus Ă©levĂ©e.
Dans un modĂšle linĂ©aire (oĂč chaque article obtient chaque annĂ©e le mĂȘme nombre de citations), si on note le nombre de citations du y-Ăšme article le plus citĂ© alors[1] :
On obtient alors la formule : oĂč est la somme totale d'articles, et est le nombre total de citations.
Exemple
Formellement, si f est la fonction qui correspond au nombre de citations pour chaque publication, nous calculons l'indice h comme suit : nous ordonnons d'abord les valeurs de f de la plus grande Ă la plus petite valeur. Ensuite, nous cherchons la derniĂšre position dans laquelle f est supĂ©rieur ou Ă©gal Ă la position (nous appelons h cette position). Par exemple, si nous avons un chercheur avec 5 publications A, B, C, D et E avec respectivement 10, 8, 5, 4 et 3 citations, l'indice h est Ă©gal Ă 4 car la 4e publication a 4 citations et la 5e n'en a que 3. En revanche, si les mĂȘmes publications ont 25, 8, 5, 3 et 3 citations, alors l'indice est 3 (c'est-Ă -dire la 3e position) car le quatriĂšme article n'a que 3 citations. De plus, l'indice n'est pas influencĂ© par l'article trĂšs rĂ©ussi.
f (A) = 10, f (B) = 8, f (C) = 5, f (D) = 4, f (E) = 3 â indice h = 4
f (A) = 25, f (B) = 8, f (C) = 5, f (D) = 3, f (E) = 3 â indice h = 3
Si nous avons la fonction f ordonnée par ordre décroissant de la plus grande valeur à la plus basse, nous pouvons calculer l'indice h comme suit :
indice h (f) =
Indice plus réaliste
L'indice prĂ©cĂ©dent ne fait pas apparaĂźtre la notion d'auteur unique ou coauteurs, ni la notion de premier auteur. Par ailleurs, dans le mĂȘme article, Hirsch propose un indice qui se veut plus rĂ©aliste[1]. La gĂ©nĂ©ralisation est de ne plus donner une relation linĂ©aire entre et h :
oĂč et vĂ©rifient l'Ă©quation :
Indice h et auto-citations
L'une des pratiques courantes des auteurs pour augmenter artificiellement leur indice h est de citer de maniĂšre disproportionnĂ©e leurs propres travaux, distorsion notĂ©e par Hirsch dans son article original[1]. Calculer un indice h corrigĂ© pour tenir compte du ratio d'auto-citations est une tĂąche fastidieuse, car les moteurs de recherche tels que le Web of Science ou Google Scholar ne permettent pas de le calculer. Une Ă©tude heuristique a montrĂ© qu'en faisant l'hypothĂšse d'un ratio d'auto-citations constant (p), l'indice h peut ĂȘtre corrigĂ© de la maniĂšre suivante pour obtenir un indice b[5] :
Critiques
Il existe plusieurs situations oĂč l'indice h peut induire en erreur Ă propos de la production scientifique[6]. La plupart de ces situations ne sont pas exclusives Ă l'indice h et peuvent s'appliquer Ă d'autres indicateurs bibliomĂ©triques.
- L'indice h ne tient pas compte du nombre de citations habituel dans diffĂ©rents domaines. Le comportement de citation varie beaucoup selon la discipline scientifique[7]. Cela invalide les comparaisons entre les disciplines, et mĂȘme dans des spĂ©cialitĂ©s d'une mĂȘme discipline[8].
- Il ne tient pas compte de la position de l'auteur dans la liste des auteurs d'un article, ni du nombre de co-auteurs, alors que cela est important dans plusieurs disciplines[9] - [10].
- Il prend en compte aussi bien les citations positives que négatives : c'est une mesure quantitative et non qualitative[11].
- Il ne prend pas en compte le biais de citation[11].
- Il ne serait qu'une simple fonction du nombre de citations, environ la racine carré divisée par deux du nombre total de citations [12].
- Une étude a trouvé que l'indice h avait une exactitude et une précision de prévision légÚrement moindre qu'une simple mesure de la moyenne de citation par article[13]. Cependant, cette étude a été contredite par une autre étude de Hirsch[14].
- L'indice h est un entier naturel, ce qui réduit son pouvoir de discrimination. Ruane et Tol ont proposé un nombre rationnel qui effectue une interpolation entre h et h + 1 [15].
- Il peut ĂȘtre manipulĂ© par auto-citation[16] - [17] - [18].
- Il est fondĂ© sur les donnĂ©es de Google Scholar, ce qui fait que mĂȘme des documents gĂ©nĂ©rĂ©s par ordinateurs (ex: SCIgen) peuvent ĂȘtre utilisĂ©s pour manipuler l'indice h[19].
- Il ne fournit pas une mesure de l'impact scientifique plus prĂ©cise que le nombre total de citations d'un chercheur. En particulier, Yong[20] a montrĂ© que la formule , oĂč N est le nombre total de citations, est une approximation fiable de l'indice h dans la plupart des cas (avec des erreurs entre 10 et 20 pour cent).
- Il est la compilation de deux informations : le nombre de citations (impact) et le nombre de publications (productivité). Ce qui est un appauvrissement qualitatif puisque deux informations sont fusionnées en une seule.
- Enfin, plus gĂ©nĂ©ralement, cet indice ne reflĂšte en rien lâimpact de la recherche qui ne peut ĂȘtre rĂ©duit au taux de citation de publications par ses pairs, donc, qui ne concerne que les cercles, trop souvent fermĂ©s, des seuls initiĂ©s. Dans le monde rĂ©el, lâimpact â sensu Ă©valuation de projet de recherche-innovation-dĂ©veloppement â dâune action de recherche est lâutilisation avĂ©rĂ©e de ses rĂ©sultats Ă un niveau plus proche des bĂ©nĂ©ficiaires (dĂ©cideurs, ingĂ©nieurs, agriculteurs, etc.), donc, dans le sens recherche vers innovation (un rĂ©sultat de recherche utilisĂ©) et dĂ©veloppement (i.e., profite Ă la sociĂ©tĂ© qui finance cette recherche). âThe producers, for whom we work, do not sell and do not eat these papersâ[21]
Notes et références
- (en) Jorge Hirsch, « An index to quantify an individual's scientific research output », Proceedings of the National Academy of Sciences, vol. 102, no 46,â , p. 16569â16572 (DOI 10.1073/pnas.0507655102, lire en ligne)
- Ivars Peterson, « Rating Researchers », Science News Online, (consulté le )
- (en) Jorge E. Hirsch, « Superconductivity, What the H? The Emperor Has No Clothes », Physics and Society,â , p. 5-9 (lire en ligne) :
« I proposed the H-index hoping it would be an objective measure of scientific achievement. By and large, I think this is believed to be the case. But I have now come to believe that it can also fail spectacularly and have severe unintended negative consequences. I can understand how the sorcererâs apprentice must have felt. (p.5) »
- « Physicist Proposes New Way to Rank Scientific Output » (consulté le )
- « A simple method for excluding selfâcitation from the hâindex: the bâindex », Online Information Review, vol. 33,â , p. 1129-1136 (ISSN 1468-4527, DOI 10.1108/14684520911011043, lire en ligne, consultĂ© le )
- (en) Michael C. Wendl, « H-index: however ranked, citations need context », Nature, vol. 449, no 7161,â , p. 403â403 (DOI 10.1038/449403b, lire en ligne, consultĂ© le )
- Lutz Bornmann et HansâDieter Daniel, « What do citation counts measure? A review of studies on citing behavior », Journal of Documentation, vol. 64, no 1,â , p. 45â80 (ISSN 0022-0418, DOI 10.1108/00220410810844150, lire en ligne, consultĂ© le )
- Anauati, Maria Victoria and Galiani, Sebastian et GĂĄlvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (November 11, 2014). Disponible Ă SSRN: http://ssrn.com/abstract=2523078
- (en) Cagan H. Sekercioglu, « Quantifying Coauthor Contributions », Science, vol. 322, no 5900,â , p. 371â371 (ISSN 0036-8075 et 1095-9203, PMID 18927373, DOI 10.1126/science.322.5900.371a, lire en ligne, consultĂ© le )
- (en) Chun-Ting Zhang, « A proposal for calculating weighted citations based on author rank », EMBO reports, vol. 10, no 5,â , p. 416â417 (ISSN 1469-221X et 1469-3178, PMID 19415071, DOI 10.1038/embor.2009.74, lire en ligne, consultĂ© le )
- (en) Nikolay K. Vitanov, Science Dynamics and Research Production: Indicators, Indexes, Statistical Laws and Mathematical Models, Springer, (lire en ligne), p. 65.
- (en) Ian Rownland, « Is it time to bury the h-index? », sur The Bibliomagician, (consulté le )
- (en) Sune Lehmann, Andrew D. Jackson et Benny E. Lautrup, « Measures for measures », Nature, vol. 444, no 7122,â , p. 1003â1004 (DOI 10.1038/4441003a, lire en ligne, consultĂ© le )
- (en) J. E. Hirsch, « Does the h index have predictive power? », Proceedings of the National Academy of Sciences, vol. 104, no 49,â , p. 19193â19198 (ISSN 0027-8424 et 1091-6490, PMID 18040045, DOI 10.1073/pnas.0707962104, lire en ligne, consultĂ© le )
- (en) Frances Ruane et Richard S. J. Tol, « Rational (successive) h-indices: An application to economics in the Republic of Ireland », Scientometrics, vol. 75, no 2,â , p. 395â405 (ISSN 0138-9130 et 1588-2861, DOI 10.1007/s11192-007-1869-7, lire en ligne, consultĂ© le )
- (en) Ramiro H. GĂĄlvez, « Assessing author self-citation as a mechanism of relevant knowledge diffusion », Scientometrics, vol. 111, no 3,â , p. 1801â1812 (ISSN 0138-9130 et 1588-2861, DOI 10.1007/s11192-017-2330-1, lire en ligne, consultĂ© le )
- (en) Christoph Bartneck et Servaas Kokkelmans, « Detecting h-index manipulation through self-citation analysis », Scientometrics, vol. 87, no 1,â , p. 85â98 (ISSN 0138-9130 et 1588-2861, DOI 10.1007/s11192-010-0306-5, lire en ligne, consultĂ© le )
- (en) Emilio Ferrara et Alfonso E. Romero, « Scientific impact evaluation and the effect of self-citations: Mitigating the bias by discounting the h-index », Journal of the American Society for Information Science and Technology, vol. 64, no 11,â , p. 2332â2339 (ISSN 1532-2890, DOI 10.1002/asi.22976, lire en ligne, consultĂ© le )
- Labbé, Cyril (2010). Ike Antkare one of the great stars in the scientific firmament (PDF). Laboratoire d'Informatique de Grenoble RR-LIG-2008 (technical report). Université Joseph-Fourier.
- Alexander Yong, Critique of Hirschâs Citation Index: A Combinatorial Fermi Problem, Notices of the American Mathematical Society, vol. 61 (2014), no 11, p. 1040â50.
- Vales M. 2017. Recurrent selection for populations-varieties obtaining - a new approach to merge modern methods and ancestral empirical know-how and genetic resources. Nov. 3rd, 2017, äșććäžć€§ćŠććŠäžçç©ææŻćŠéą/College of Agriculture and Biotechnology, Yunnan Agricultural University, Kunming, Yunnan, China: 71 slides
Source
- (en) H.L. Roediger, « The h Index in Science: A New Measure of Scholarly Contribution », Observer, vol. 19,â (lire en ligne)
- Yves Gingras et Mahdi Khelfaoui, « Einstein vaut-il la moitiĂ© du Dr Raoult ? Pour en finir avec « lâindice h » », sur The Conversation, .
Voir aussi
Articles connexes
- Indice g (en)
- Facteur d'impact
- Bibliométrie
- Scientométrie
Lien externe
- Index par journal et pays