ARN long non-codant
Un ARN long non-codant (ARNlnc) est généralement défini comme étant un transcrit d'une longueur supérieure ou égale à 200 nucléotides et qui ne code pas une protéine[1], ou plus précisément, qui n'a pas de cadre de lecture ouvert comparable à celui d'un ARN messager. Les ARNlnc constituent la plus vaste classe de gènes chez les mammifères, mais sont encore très mal connus[2].
Les fonctions biologiques des ARNlnc sont mal connues, mais ces transcrits (et donc les gènes qui les codent) semblent être des régulateurs de l'expression d'autres gènes[3], et sont impliqués dans de nombreux processus biologiques[4] - [5] et maladies[6] - [7].
La transcription d'une partie des ARNlnc est assurée par l'ARN polymérase II, comme pour les ARN messagers. Les transcrits produits subissent l'épissage et reçoivent une coiffe et une queue dite « poly-A ». Le niveau d'expression des ARNlnc (c'est-à -dire la quantité de transcrits produits) est inférieure à celle des ARN messagers, d'un facteur 10 environ[8]. De plus, l'expression des ARNlnc est plus « tissu-spécifique » que celle des ARNm, ce qui signifie qu'ils ont une tendance plus forte à n'être exprimé que dans quelques tissus, voire parfois un seul[9].
Les gènes à ARNlnc semblent être issus d'anciens gènes codant des protéines qui auraient perdus leurs fonctions et seraient devenus des sortes de pseudo-gènes toujours fonctionnels[10]. Ils sont moins bien conservés que les gènes codants des protéines.
Chez l'humain, l'annotation Ensembl du génome dénombrait début 2021 environ 20 000 gènes codant des protéines et environ 16 000 gènes à ARNlnc[11].
Cadre historique
Les régions non-codantes du génome, ou « Junk DNA »
Le séquençage du génome humain, achevé en 2004, a révélé que seul 1,2% du génome code des protéines[12]. Cette observation appuyait l'idée née dans les années 1960-1970 que l'immense majorité du génome était inutile, puisque non-codante. Cette idée était née pour résoudre l'« énigme de la C-value », c'est-à -dire le fait que la taille des génomes (en nombre de paires de bases ou en masse d'ADN) n'était pas corrélée avec la complexité de l'organisme[13] - [14]. On disait alors qu'elle constituait de l'« ADN poubelle » (« Junk DNA »[15] en anglais).
Néanmoins, déjà dans les années 1990, des travaux tendaient à suggérer que cet ADN poubelle n'était pas uniquement composé de séquences aléatoires et portait une information biologique[16], voire que certaines de ces régions étaient conservées entre l'humain et la souris[17]. Des expériences menées au début des années 2000 avaient de plus montré que l'annotation du génome humain, c'est-à -dire la connaissance des positions des gènes et de leur structure (les exons et les introns en particulier, on parle aussi de modèle de gène) était encore très lacunaire[18] - [19]. Ces expériences, dites de « tiling arrays », consistaient à utiliser des puces à ADN avec des sondes correspondant chacune à un bout de la séquence d'un chromosome, de façon que toute la séquence du chromosome soit représentée sur la puce. L'ensemble des transcrits humains étaient ensuite déposés sur la puce, de façon à pouvoir détecter ceux qui s'hybridaient avec les sondes de la puce, et qui étaient donc transcrits depuis le chromosome en question. Plusieurs hypothèses tentaient d'expliquer ces lacunes :
- soit les modèles de gènes de l'époque étaient simplement incomplets,
- soit les gènes nouvellement détectés lors de ces expériences n'étaient pas suffisamment exprimés pour avoir été détectés jusqu'alors,
- soit enfin les filtres appliqués sur les séquences ayant servi à créer les modèles, et pensés pour ne retenir que les gènes avec un potentiel codant, avaient éliminé des séquences transcrites, mais non codantes.
C'est la dernière hypothèse qui s'avèrera exacte.
En plus de ces observations générales à l'échelle du génome, des études plus ciblées ont mise en évidence l'existence de gènes transcrits et apparemment dépourvus de potentiel codant.
Mise en évidence de l'existence de gènes non-codants
L'idée que des ARN puissent ne pas seulement être des intermédiaires entre l'ADN et les protéines n'était pas neuve au début du XXIe siècle, puisque les découvertes des ARN ribosomiques et des ARN de transfert sont antérieures (1955 et 1957, respectivement)[20] à celle des ARN messagers (1961)[21]. À la fin des années 1980 apparait par ailleurs l'hypothèse du monde à ARN, basée sur une l'idée proposée en 1962[22] que l'ARN soit le précurseur des macromolécules biologiques (en particulier l'ADN et les protéines). L'hypothèse s'appuie sur le fait que l'ARN puisse être considéré comme un support d'information génétique (le génome des virus à ARN par exemple), sur les observations que des ARN sont capables d'activités catalytiques (on parle de ribozymes) voire auto-catalytiques, et sur les observations de systèmes de régulations basés sur l'ARN (on parle de riboswitches).
En ce qui concerne les ARNlnc précisément, l'existence d'ARN régulant la transcription (appelés « RNA activators ») avait été théorisée à la fin des années 1960[23]. Au début des années 1970, des « ARN hétérogènes nucléaires » (« heterogeneous nuclear RNAs »), surtout localisés dans le noyau cellulaire, avaient été mis en évidence[24] - [25]. Finalement, en 1990, l'étude de gènes comme H19 (un gène sous empreinte parentale impliqué dans la croissance[26]) ou Xist (impliqué dans l'inactivation du chromosome X) chez la souris révèlerons que leur produit fonctionnel est un ARNlnc[27] - [28] - [29] et non une protéine.
La limite arbitraire des 200 nucléotides
Le seuil de 200 nucléotides pour séparer les catégories des ARN « longs » non-codants des ARN « courts » non-codants est arbitraire. Il pourrait avoir une raison expérimentale : les kits d'extractions des ARN utilisés dans une étude de 2007 sur les ARNlnc ne retenaient pas les ARN d'une taille inférieure[30].
Propriétés biologiques des ARNlnc
En plus de leur absence de cadres de lecture ouverts comparables aux gènes codants des protéines, les ARNlnc sont plus souvent présents dans la noyau cellulaire, ont un niveau d'expression (dit autrement, une quantité de transcrits) plus faibles et ont tendance à être exprimés dans moins de tissus.
Localisation cellulaire
Les ARNlnc sont préférentiellement localisés dans le noyau cellulaire, par contraste avec les ARN messagers qui sont pour leur part exportés vers le cytoplasme[31], où ils subissent la traduction. Au sein du noyau, les ARNlnc sont particulièrement enrichis dans la chromatine[32], en particulier dans les speckles (des domaines contenant des protéines associées à la transcription et la maturation des ARN messagers) et les paraspeckles (des domaines impliqués dans la rétention des ARN messagers dans le noyau)[33], ce qui est à rapprocher de leurs fonctions connues ou supposées de régulateurs de l'expression d'autres gènes. Des ARNlnc ont également été mis en évidence dans le nucléole[2].
Les ARNlnc ne sont pour autant pas uniquement nucléaires[34], puisqu'on en trouve également dans le cytoplasme, associés avec des ribosomes[35], au sein des mitochondries[36], dans les membranes cellulaires[37] et même dans des exosomes[38].
Niveau d'expression
Le niveau d'expression d'un gène correspond à un proxy du nombre de transcrits de ce gène dans un échantillon donné. Il se mesure notamment par RNA-seq, micro-array, ou encore RT-PCRq. Pour les ARN lnc ce niveau est environ 10 fois plus faible pour les ARNlnc que pour les ARN messagers[32] - [39].
Tissu-spécificité
L’expression des ARNlnc est plus "tissu-spécifique" que celle des ARNm, issus des gènes codants. Les ARNlnc ont donc une plus forte tendance que les ARNm à être exprimés dans quelques tissus d'un organisme à un niveau donné, et à des niveaux bien plus faibles dans les autres, voire exprimés uniquement dans un tissu et pas du tout dans les autres.
Le pourcentage d'ARNlnc tissu-spécifiques varie selon la méthode employée pour déterminer la tissu-spécificité, ou encore selon le nombre de tissus considérés. Selon les études donc, on estime que 60 à 80% des ARNlnc sont tissu-spécifiques (contre 20% à 30% des ARNm)[40] - [41] - [42].
Le testicule est par ailleurs un tissu dans lequel semble se trouver un grand nombre de LNC tissus-spécifiques[43].
Conservation
Contrairement aux gènes codants des protéines, les gènes à ARN longs non-codants sont très peu conservés en séquence entre les espèces[44] - [45]. Les exons des ARNlnc subissent néanmoins une pression de sélection plus forte que les régions inter-géniques environnantes ou que les introns. Les régions promotrices et les séquences en amont des sites d'initiation de la transcription subissent également une pression de sélection, et sont même mieux conservés entre espèces pour les gènes à ARNlnc que pour les gènes codants[46]. Il semble enfin que des paires « gène codant une protéine — promoteur de gène à ARNlnc » soient conservées entre espèces[47].
En revanche, il a été montré que des gènes à ARN longs non-codants présentent une conservation synténique[48], c'est-à -dire que leur position par rapport à d'autres gènes (conservés) est la même d'une espèce à l'autre. Finalement, un petit nombre de gènes à ARNlnc présente bien une conservation en séquence et en structure (nombre d'exons par exemple), comme MALAT1 ou NEAT1[49]
Notes et références
- (en) Jeffrey J. Quinn et Howard Y. Chang, « Unique features of long non-coding RNA biogenesis and function », Nature Reviews Genetics, vol. 17, no 1,‎ , p. 47–62 (ISSN 1471-0056 et 1471-0064, DOI 10.1038/nrg.2015.10, lire en ligne, consulté le )
- (en) Joana Carlevaro-Fita et Rory Johnson, « Global Positioning System: Understanding Long Noncoding RNAs through Subcellular Localization », Molecular Cell, vol. 73, no 5,‎ , p. 869–883 (DOI 10.1016/j.molcel.2019.02.008, lire en ligne, consulté le )
- (en) Heeyoun Bunch, « Gene regulation of mammalian long non-coding RNA », Molecular Genetics and Genomics, vol. 293, no 1,‎ , p. 1–15 (ISSN 1617-4615 et 1617-4623, DOI 10.1007/s00438-017-1370-9, lire en ligne, consulté le )
- Ezio T. Fok, Laurianne Davignon, Stephanie Fanucchi et Musa M. Mhlanga, « The lncRNA Connection Between Cellular Metabolism and Epigenetics in Trained Immunity », Frontiers in Immunology, vol. 9,‎ , p. 3184 (ISSN 1664-3224, DOI 10.3389/fimmu.2018.03184, lire en ligne, consulté le )
- (en) Hui Sun, Zhaohui Huang, Weiqi Sheng et Mi-die Xu, « Emerging roles of long non-coding RNAs in tumor metabolism », Journal of Hematology & Oncology, vol. 11, no 1,‎ , p. 106 (ISSN 1756-8722, PMID 30134946, PMCID PMC6104013, DOI 10.1186/s13045-018-0648-7, lire en ligne, consulté le )
- Yin Liu, Sambad Sharma et Kounosuke Watabe, « Roles of lncRNA in breast cancer », Frontiers in bioscience (Scholar edition), vol. 7,‎ , p. 94–108 (ISSN 1945-0516, PMID 25961689, PMCID 5651513, lire en ligne, consulté le )
- (en) Hu Peng, Lin-Yan Wan, Jia-Jie Liang et Yan-Qiong Zhang, « The roles of lncRNA in hepatic fibrosis », Cell & Bioscience, vol. 8, no 1,‎ , p. 63 (ISSN 2045-3701, PMID 30534359, PMCID PMC6282372, DOI 10.1186/s13578-018-0259-6, lire en ligne, consulté le )
- (en) T. Derrien, R. Johnson, G. Bussotti et A. Tanzer, « The GENCODE v7 catalog of human long noncoding RNAs: Analysis of their gene structure, evolution, and expression », Genome Research, vol. 22, no 9,‎ , p. 1775–1789 (ISSN 1088-9051, PMID 22955988, PMCID PMC3431493, DOI 10.1101/gr.132159.111, lire en ligne, consulté le )
- (en) Kaia Mattioli, Pieter-Jan Volders, Chiara Gerhardinger et James C. Lee, « High-throughput functional analysis of lncRNA core promoters elucidates rules governing tissue specificity », Genome Research, vol. 29, no 3,‎ , p. 344–355 (ISSN 1088-9051 et 1549-5469, DOI 10.1101/gr.242222.118, lire en ligne, consulté le )
- (en) Hadas Hezroni, Rotem Ben-Tov Perry, Zohar Meir et Gali Housman, « A subset of conserved mammalian long non-coding RNAs are fossils of ancestral protein-coding genes », Genome Biology, vol. 18, no 1,‎ , p. 162 (ISSN 1474-760X, PMID 28854954, PMCID PMC5577775, DOI 10.1186/s13059-017-1293-0, lire en ligne, consulté le )
- (en) « Statistiques concernant l'annotation du génome humain sur Ensembl.org », sur Ensembl, (consulté le )
- (en) International Human Genome Sequencing Consortium, « Finishing the euchromatic sequence of the human genome », Nature, vol. 431, no 7011,‎ , p. 931–945 (ISSN 0028-0836 et 1476-4687, DOI 10.1038/nature03001, lire en ligne, consulté le )
- R. Vendrely et C. Vendrely, « La teneur du noyau cellulaire en acide désoxyribonucléique à travers les organes, les individus et les espèces animales », Experientia, vol. 4, no 11,‎ , p. 434–436 (ISSN 0014-4754 et 1420-9071, DOI 10.1007/BF02144998, lire en ligne, consulté le )
- (en) C A Thomas, « The Genetic Organization of Chromosomes », Annual Review of Genetics, vol. 5, no 1,‎ , p. 237–256 (ISSN 0066-4197 et 1545-2948, DOI 10.1146/annurev.ge.05.120171.001321, lire en ligne, consulté le )
- S. Ohno, « So much "junk" DNA in our genome », Brookhaven Symposia in Biology, vol. 23,‎ , p. 366–370 (ISSN 0068-2799, PMID 5065367, lire en ligne, consulté le )
- (en) R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger et S. Havlin, « Linguistic Features of Noncoding DNA Sequences », Physical Review Letters, vol. 73, no 23,‎ , p. 3169–3172 (ISSN 0031-9007, DOI 10.1103/PhysRevLett.73.3169, lire en ligne, consulté le )
- (en) Ben F. Koop et Leroy Hood, « Striking sequence similarity over almost 100 kilobases of human and mouse T–cell receptor DNA », Nature Genetics, vol. 7, no 1,‎ , p. 48–53 (ISSN 1061-4036 et 1546-1718, DOI 10.1038/ng0594-48, lire en ligne, consulté le )
- P. Kapranov, « Large-Scale Transcriptional Activity in Chromosomes 21 and 22 », Science, vol. 296, no 5569,‎ , p. 916–919 (DOI 10.1126/science.1068597, lire en ligne, consulté le )
- (en) P. Bertone, « Global Identification of Human Transcribed Sequences with Genome Tiling Arrays », Science, vol. 306, no 5705,‎ , p. 2242–2246 (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.1103388, lire en ligne, consulté le )
- Julien Jarroux, Antonin Morillon et Marina Pinskaya, « History, Discovery, and Classification of lncRNAs », dans Long Non Coding RNA Biology, vol. 1008, Springer Singapore, (ISBN 978-981-10-5202-6, DOI 10.1007/978-981-10-5203-3_1, lire en ligne), p. 1–46
- (en) S. Brenner, F. Jacob et M. Meselson, « An Unstable Intermediate Carrying Information from Genes to Ribosomes for Protein Synthesis », Nature, vol. 190, no 4776,‎ , p. 576–581 (ISSN 0028-0836 et 1476-4687, DOI 10.1038/190576a0, lire en ligne, consulté le )
- A. Rich, « On the problems of evolution and biochemical information transfer », Horizons In Biochemistry,‎ , p. 103-126
- (en) R. J. Britten et E. H. Davidson, « Gene Regulation for Higher Cells: A Theory », Science, vol. 165, no 3891,‎ , p. 349–357 (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.165.3891.349, lire en ligne, consulté le )
- (en) D. S. Holmes, J. E. Mayfield, G. Sander et J. Bonner, « Chromosomal RNA: Its Properties », Science, vol. 177, no 4043,‎ , p. 72–74 (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.177.4043.72, lire en ligne, consulté le )
- (en) Mary Ella Pierpont et Jorge J. Yunis, « Localization of chromosomal RNA in human G-banded metaphase chromosomes », Experimental Cell Research, vol. 106, no 2,‎ , p. 303–308 (DOI 10.1016/0014-4827(77)90176-8, lire en ligne, consulté le )
- (en) A. Gabory, M.-A. Ripoche, A. Le Digarcher et F. Watrin, « H19 acts as a trans regulator of the imprinted gene network controlling growth in mice », Development, vol. 136, no 20,‎ , p. 3413–3421 (ISSN 0950-1991 et 1477-9129, DOI 10.1242/dev.036061, lire en ligne, consulté le )
- (en) C I Brannan, E C Dees, R S Ingram et S M Tilghman, « The product of the H19 gene may function as an RNA. », Molecular and Cellular Biology, vol. 10, no 1,‎ , p. 28–36 (ISSN 0270-7306 et 1098-5549, PMID 1688465, PMCID PMC360709, DOI 10.1128/MCB.10.1.28, lire en ligne, consulté le )
- (en) Neil Brockdorff, Alan Ashworth, Graham F. Kay et Veronica M. McCabe, « The product of the mouse Xist gene is a 15 kb inactive X-specific transcript containing no conserved ORF and located in the nucleus », Cell, vol. 71, no 3,‎ , p. 515–526 (DOI 10.1016/0092-8674(92)90519-I, lire en ligne, consulté le )
- (en) Carolyn J. Brown, Brian D. Hendrich, Jim L. Rupert et Ronald G. Lafrenière, « The human XIST gene: Analysis of a 17 kb inactive X-specific RNA that contains conserved repeats and is highly localized within the nucleus », Cell, vol. 71, no 3,‎ , p. 527–542 (DOI 10.1016/0092-8674(92)90520-M, lire en ligne, consulté le )
- (en) P. Kapranov, J. Cheng, S. Dike et D. A. Nix, « RNA Maps Reveal New RNA Classes and a Possible Function for Pervasive Transcription », Science, vol. 316, no 5830,‎ , p. 1484–1488 (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.1138341, lire en ligne, consulté le )
- Sarah Djebali, Carrie A. Davis, Angelika Merkel et Alex Dobin, « Landscape of transcription in human cells », Nature, vol. 489, no 7414,‎ , p. 101–108 (ISSN 0028-0836, PMID 22955620, PMCID 3684276, DOI 10.1038/nature11233, lire en ligne, consulté le )
- (en) T. Derrien, R. Johnson, G. Bussotti et A. Tanzer, « The GENCODE v7 catalog of human long noncoding RNAs: Analysis of their gene structure, evolution, and expression », Genome Research, vol. 22, no 9,‎ , p. 1775–1789 (ISSN 1088-9051, PMID 22955988, PMCID PMC3431493, DOI 10.1101/gr.132159.111, lire en ligne, consulté le )
- Joana Carlevaro-Fita et Rory Johnson, « Global Positioning System: Understanding Long Noncoding RNAs through Subcellular Localization », Molecular Cell, vol. 73, no 5,‎ , p. 869–883 (ISSN 1097-2765, DOI 10.1016/j.molcel.2019.02.008, lire en ligne, consulté le )
- (en) David Mas-Ponte, Joana Carlevaro-Fita, Emilio Palumbo et Toni Hermoso Pulido, « LncATLAS database for subcellular localization of long noncoding RNAs », RNA, vol. 23, no 7,‎ , p. 1080–1087 (ISSN 1355-8382 et 1469-9001, PMID 28386015, PMCID PMC5473142, DOI 10.1261/rna.060814.117, lire en ligne, consulté le )
- (en) Chao Zeng, Tsukasa Fukunaga et Michiaki Hamada, « Identification and analysis of ribosome-associated lncRNAs using ribosome profiling data », BMC Genomics, vol. 19, no 1,‎ , p. 414 (ISSN 1471-2164, PMID 29843593, PMCID PMC5975437, DOI 10.1186/s12864-018-4765-z, lire en ligne, consulté le )
- (en) Yaru Dong, Takeshi Yoshitomi, Ji-Fan Hu et Jizhe Cui, « Long noncoding RNAs coordinate functions between mitochondria and the nucleus », Epigenetics & Chromatin, vol. 10, no 1,‎ , p. 41 (ISSN 1756-8935, PMID 28835257, PMCID PMC5569521, DOI 10.1186/s13072-017-0149-x, lire en ligne, consulté le )
- (en) Aifu Lin, Qingsong Hu, Chunlai Li et Zhen Xing, « The LINK-A lncRNA interacts with PtdIns(3,4,5)P3 to hyperactivate AKT and confer resistance to AKT inhibitors », Nature Cell Biology, vol. 19, no 3,‎ , p. 238–251 (ISSN 1465-7392 et 1476-4679, PMID 28218907, PMCID PMC5332298, DOI 10.1038/ncb3473, lire en ligne, consulté le )
- (en) Ugur Gezer, Emre Özgür, Merve Cetinkaya et Mustafa Isin, « Long non-coding RNAs with low expression levels in cells are enriched in secreted exosomes: Long non-coding RNAs in secreted exosomes », Cell Biology International,‎ , n/a–n/a (DOI 10.1002/cbin.10301, lire en ligne, consulté le )
- (en) M. N. Cabili, C. Trapnell, L. Goff et M. Koziol, « Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses », Genes & Development, vol. 25, no 18,‎ , p. 1915–1927 (ISSN 0890-9369, PMID 21890647, PMCID PMC3185964, DOI 10.1101/gad.17446611, lire en ligne, consulté le )
- (en) M. N. Cabili, C. Trapnell, L. Goff et M. Koziol, « Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses », Genes & Development, vol. 25, no 18,‎ , p. 1915–1927 (ISSN 0890-9369, PMID 21890647, PMCID PMC3185964, DOI 10.1101/gad.17446611, lire en ligne, consulté le )
- (en) Julia D. Ransohoff, Yuning Wei et Paul A. Khavari, « The functions and unique features of long intergenic non-coding RNA », Nature Reviews Molecular Cell Biology, vol. 19, no 3,‎ , p. 143–157 (ISSN 1471-0072 et 1471-0080, PMID 29138516, PMCID PMC5889127, DOI 10.1038/nrm.2017.104, lire en ligne, consulté le )
- (en) Zhonglin Tang, Yang Wu, Yalan Yang et Yu-Cheng T. Yang, « Comprehensive analysis of long non-coding RNAs highlights their spatio-temporal expression patterns and evolutional conservation in Sus scrofa », Scientific Reports, vol. 7, no 1,‎ , p. 43166 (ISSN 2045-2322, PMID 28233874, PMCID PMC5324117, DOI 10.1038/srep43166, lire en ligne, consulté le )
- (en) M. Mele, P. G. Ferreira, F. Reverter et D. S. DeLuca, « The human transcriptome across tissues and individuals », Science, vol. 348, no 6235,‎ , p. 660–665 (ISSN 0036-8075 et 1095-9203, PMID 25954002, PMCID PMC4547472, DOI 10.1126/science.aaa0355, lire en ligne, consulté le )
- (en) J. Ponjavic, C. P. Ponting et G. Lunter, « Functionality or transcriptional noise? Evidence for selection within long noncoding RNAs », Genome Research, vol. 17, no 5,‎ , p. 556–565 (ISSN 1088-9051, PMID 17387145, PMCID PMC1855172, DOI 10.1101/gr.6036807, lire en ligne, consulté le )
- (en) Ana C Marques et Chris P Ponting, « Catalogues of mammalian long noncoding RNAs: modest conservation and incompleteness », Genome Biology, vol. 10, no 11,‎ , R124 (ISSN 1465-6906, PMID 19895688, PMCID PMC3091318, DOI 10.1186/gb-2009-10-11-r124, lire en ligne, consulté le )
- (en) The FANTOM Consortium, « The Transcriptional Landscape of the Mammalian Genome », Science, vol. 309, no 5740,‎ , p. 1559–1563 (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.1112014, lire en ligne, consulté le )
- (en) Teresa M. R. Noviello, Antonella Di Liddo, Giovanna M. Ventola et Antonietta Spagnuolo, « Detection of long non–coding RNA homology, a comparative study on alignment and alignment–free metrics », BMC Bioinformatics, vol. 19, no 1,‎ , p. 407 (ISSN 1471-2105, PMID 30400819, PMCID PMC6220562, DOI 10.1186/s12859-018-2441-6, lire en ligne, consulté le )
- (en) Igor Ulitsky, Alena Shkumatava, Calvin H. Jan et Hazel Sive, « Conserved Function of lincRNAs in Vertebrate Embryonic Development despite Rapid Sequence Evolution », Cell, vol. 147, no 7,‎ , p. 1537–1550 (PMID 22196729, PMCID PMC3376356, DOI 10.1016/j.cell.2011.11.055, lire en ligne, consulté le )
- (en) Per Johnsson, Leonard Lipovich, Dan Grandér et Kevin V. Morris, « Evolutionary conservation of long non-coding RNAs; sequence, structure, function », Biochimica et Biophysica Acta (BBA) - General Subjects, vol. 1840, no 3,‎ , p. 1063–1071 (PMID 24184936, PMCID PMC3909678, DOI 10.1016/j.bbagen.2013.10.035, lire en ligne, consulté le )