
En gĂ©nĂ©tique molĂ©culaire, un cadre de lecture ouvert, ou phase ouverte de lecture (open reading frame ou ORF en anglais), est une partie d'un cadre de lecture dĂ©limitĂ© par deux codons STOP[1], offrant la possibilitĂ© d'ĂȘtre transcrit en ARN, puis, potentiellement, traduit en protĂ©ine ou en peptide. C'est une suite de codons comprenant le codon-start (gĂ©nĂ©ralement AUGchez les organismes eucaryotes) et se termine par un codon-stop (gĂ©nĂ©ralement UAA, UAG ou UGA), auquel ne correspond aucun acide aminĂ©. Le codon d'initiation AUG (codon-start) du cadre de lecture ouvert â codon qui n'est pas nĂ©cessairement le premier de celui-ci â peut indiquer un dĂ©but de la traduction. Le site de terminaison de la transcription est situĂ© aprĂšs le cadre de lecture ouvert, au-delĂ du codon stop. La notion de cadre de lecture ouvert est trĂšs utilisĂ©e pour la prĂ©diction de gĂšnes.
On reconnaßt le plus souvent les cadres de lecture ouverts qui codent des protéines à leur longueur. Le code génétique comportant 64 codons, dont trois codons stop, la longueur moyenne d'un cadre de lecture ouvert dans une séquence « aléatoire » est d'une vingtaine de codons. Les chaßnes protéiques, dont la longueur moyenne est de 300 à 400 résidus d'acides aminés, sont associées à des cadres de lecture ouverts de 300 à 400 codons, qui sont donc facilement reconnaissables par rapport au bruit de fond.
Chez les eucaryotes, les gĂšnes contiennent gĂ©nĂ©ralement plusieurs exons et introns, de sorte que les cadres de lecture ouverts s'Ă©tendent sur plusieurs exons ; ces derniers sont Ă©pissĂ©s pour en Ă©liminer les introns dans l'ARN messager afin de reconstituer la sĂ©quence codante (coding DNA sequence ou CDS en anglais), laquelle est toujours incluse dans un cadre de lecture ouvert avec, Ă l'amont de la sĂ©quence codante, la rĂ©gion 5â non traduite (5â-UTR) et, en aval de la sĂ©quence codante, la rĂ©gion 3â non traduite (3â-UTR). Les introns peuvent contenir des codons stop et n'ont pas nĂ©cessairement une taille divisible par 3. La notion de cadre de lecture ouvert s'applique donc Ă l'ARNm mature, aprĂšs Ă©pissage.
Dans le cadre de la prédiction de gÚnes, la définition [start - stop] d'un cadre ouvert de lecture est parfois remise en cause, au profit d'une définition [stop - stop][2],[3] jugée plus générale, car pouvant s'appliquer à la recherche d'exons dans les génomes eucaryotes et à l'analyse de gÚnes/transcrits partiels, obtenus par exemple par séquençage de transcriptomes ou de métagénomes.
Description
[modifier | modifier le code]Chaque sĂ©quence d'ADN peut ĂȘtre lue selon 3 cadres de lecture dĂ©calĂ©s d'un nuclĂ©otide les uns par rapport aux autres (0, +1, +2). Sur l'ADN, il peut y avoir transcription en ARN de l'un ou l'autre des deux brins, ce qui conduit Ă un total de six cadres de lecture.
La recherche des cadres de lecture ouverts a été facilitée par l'apparition d'outils bioinformatiques performants. Cette recherche est plus facile chez les procaryotes que chez les eucaryotes, les gÚnes de ces derniers étant composés d'une succession d'introns et d'exons.
Cadre de lecture ouvert non canonique
[modifier | modifier le code]Au cÎté des cadres de lecture ouverts (ORF) correspondant aux gÚnes et codant des protéines, on observe dans le génome présumé non codant des cadres de lecture ouverts atypiques, dits « non canoniques » (ncORF) qui codent aussi des peptides, plus ou moins stables et englobés sous la dénomination de « protéome sombre ». En effet, certains ARN transcrits sur ces ncORF sont capables d'interagir avec les ribosomes pour produire de microprotéines. La traduction de ces cadres de lecture ouverts non canoniques « a été observée dans tous les types de cellules humaines et dans tous les états pathologiques, avec des implications majeures pour la protéomique, la génomique et la science clinique. »[4],[5]
Une Ă©tude panprotĂ©omique montre qu'au moins 25 % d'un ensemble de 7 264 ncORF donnent lieu Ă des produits gĂ©niques traduits, produisant plus de 3 000 peptides. Les progrĂšs de la protĂ©omique, de lâimmunopeptidomique, de profilage ribosomique (en) (Ribo-seq) et de lâannotation gĂ©nĂ©tique (en) permettent d'Ă©claircir le rĂŽle de ces ncORF[5]. Une plateforme permettra de faire progresser la comprĂ©hension des implications biomĂ©dicales des peptides dĂ©rivĂ©s de ncORF[6].
Liens externes
[modifier | modifier le code]- Projet EMBOSS - une interface web pour extraire les ORF d'une séquence génétique
- Bioinformatics.org - une interface web pour extraire les ORF d'une séquence génétique
Références
[modifier | modifier le code]- â Patricia Sieber, Matthias Platzer et Stefan Schuster, « The Definition of Open Reading Frame Revisited », Trends in Genetics, vol. 34, no 3,â , p. 167â170 (ISSN 0168-9525, DOI 10.1016/j.tig.2017.12.009, lire en ligne, consultĂ© le )
- â Claverie, J.-M. (1997) Computational methods for the identification of genes in vertebrate genomic sequences. Hum. Mol. Genet. 6, 1735â1744.
- â P. Sieber, M. Platzer, S. Schuster (2018) The definition of open reading frame revisited. Trends Genet. 34, 167-170.
- â (en) « âDark proteomeâ survey reveals thousands of new human genes », sur www.science.org (consultĂ© le )
- Kareen Fontaine & J. Paiano, « Des « gĂšnes sombres » cachĂ©s dans lâADN humain rĂ©vĂ©lĂ©s par une Ă©tude », sur Trust My Science, (consultĂ© le )
- â (en) Eric W Deutsch, Leron W Kok, Jonathan M Mudge, Jorge Ruiz-Orera, Ivo Fierro-Monti, Zhi Sun, Jennifer G Abelin, M Mar Alba, Julie L Aspden, Ariel A Bazzini, Elspeth A Bruford, Marie A Brunet, Lorenzo Calviello, Steven A Carr, Anne-Ruxandra Carvunis, Sonia Chothani, Jim Clauwaert, Kellie Dean, Pouya Faridi, Adam Frankish, Norbert Hubner, Nicholas T Ingolia, Michele Magrane, Maria Jesus Martin, Thomas F Martinez, Gerben Menschaert, Uwe Ohler, Sandra Orchard, Owen Rackham, Xavier Roucou, Sarah A Slavoff, Eivind Valen, Aaron Wacholder, Jonathan S Weissman, Wei Wu, Zhi Xie, Jyoti Choudhary, Michal Bassani-Sternberg, Juan Antonio VizcaĂno, Nicola Ternette, Robert L Moritz, John R Prensner & Sebastiaan van Heesch, « High-quality peptide evidence for annotating non-canonical open reading frames as human proteins », BioRxiv,â (DOI 10.1101/2024.09.09.612016, lire en ligne, consultĂ© le ).
