Accueil🇫🇷Chercher

Cadre de lecture ouvert

En génétique moléculaire, un cadre de lecture ouvert, ou phase ouverte de lecture (open reading frame ou ORF en anglais), est une partie d'un cadre de lecture susceptible d'être traduit en protéine ou en peptide. C'est une suite de codons comprenant le codon start et un codon stop, généralement UAA, UAG ou UGA. Un codon d'initiation AUG du cadre de lecture ouvert — codon qui n'est pas nécessairement le premier de celui-ci — peut indiquer le début de la traduction. Le site de terminaison de la transcription est situé après le cadre de lecture ouvert, au-delà du codon stop. La notion de cadre de lecture ouvert est très utilisée pour la prédiction de gènes.

Échantillon

On reconnaĂ®t le plus souvent les cadres de lecture ouverts qui codent des protĂ©ines Ă  leur longueur. Le code gĂ©nĂ©tique comportant 64 codons, dont trois codons stop, la longueur moyenne d'un cadre de lecture ouvert dans une sĂ©quence « alĂ©atoire » est d'une vingtaine de codons. Les chaĂ®nes protĂ©iques, dont la longueur moyenne est de 300 Ă  400 rĂ©sidus d'acides aminĂ©s, sont associĂ©es Ă  des cadres de lecture ouverts de 300 Ă  400 codons, qui sont donc facilement reconnaissables par rapport au bruit de fond.

Chez les eucaryotes, les gènes contiennent généralement plusieurs exons, de sorte que les cadres de lecture ouverts s'étendent sur plusieurs exons ; ces derniers sont épissés pour en éliminer les introns dans l'ARN messager afin de reconstituer la séquence codante (coding DNA sequence ou CDS en anglais), laquelle est toujours incluse dans un cadre de lecture ouvert avec, à l'amont de la séquence codante, la région 5’ non traduite (5’-UTR) et, en aval de la séquence codante, la région 3’ non traduite (3’-UTR). Les introns peuvent contenir des codons stop et n'ont pas nécessairement une taille divisible par 3. La notion de cadre de lecture ouvert s'applique donc à l'ARNm mature, après épissage.

Dans le cadre de la prédiction de gènes, la définition start-stop d'un cadre ouvert de lecture est parfois remise en cause, au profit d'une définition stop-stop[1] - [2] jugée plus générale, car pouvant s'appliquer à la recherche d'exons dans les génomes eucaryotes et à l'analyse de gènes/transcrits partiels, obtenus par exemple par séquençage de transcriptomes ou de métagénomes.

Description

Chaque séquence d'ADN peut contenir trois cadres de lecture décalés d'un nucléotide les uns par rapport aux autres (+1 ou -1). Sur l'ADN, il peut y avoir transcription en ARN de l'un ou l'autre des deux brins, ce qui conduit à un total de six cadres de lecture.

La recherche des cadres de lecture ouverts a été facilitée par l'apparition d'outils bioinformatiques performants. Cette recherche est plus facile chez les procaryotes que chez les eucaryotes, les gènes de ces derniers étant composés d'une succession d'introns et d'exons.

Liens externes

  • Projet EMBOSS - une interface web pour extraire les ORF d'une sĂ©quence gĂ©nĂ©tique
  • Bioinformatics.org - une interface web pour extraire les ORF d'une sĂ©quence gĂ©nĂ©tique

Références

  1. Claverie, J.-M. (1997) Computational methods for the identification of genes in vertebrate genomic sequences. Hum. Mol. Genet. 6, 1735–1744.
  2. P. Sieber, M. Platzer, S. Schuster (2018) The definition of open reading frame revisited. Trends Genet. 34, 167-170.
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.