Aller au contenu

Génome

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 23 novembre 2011 à 11:17 et modifiée en dernier par Fdardel (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
De l'ADN à la vie.

Le génome est l'ensemble du matériel génétique d'un individu ou d'une espèce codé dans son ADN (à l'exception de certains virus dont le génome est porté par des molécules d'ARN). Il contient en particulier toutes les séquences codantes (transcrites en ARN messagers, et traduites en protéines) et non-codantes (non transcrites, ou transcrites en ARN, mais non traduites).

Le génome est souvent comparé à une encyclopédie dont les différents volumes seraient les chromosomes. Les gènes seraient les phrases contenues dans ces volumes et ces phrases seraient écrites dans un langage génétique représenté par quatre bases (adénine, guanine, cytosine et thymine) abrégées en AGCT.

La science qui étudie le génome est la génomique.

Génomes dans le monde vivant

Les 46 chromosomes qui forment le caryotype du génome humain

Chez les virus, le génome est contenu soit dans une (ou plusieurs) molécule(s) d'ADN ou d'ARN, à simple ou double brin.

Chez les procaryotes (bactéries et archées), le génome est généralement contenu dans une molécule d'ADN circulaire. Peut aussi exister un génome extrachromosomique, contenu dans des plasmides et des épisomes. Certaines bactéries, comme les actinomycètes, ont cependant des génomes linéaires

Chez les eucaryotes, on distingue :

  • le génome nucléaire, contenu dans le noyau qui caractérise les eucaryotes. C'est de ce génome dont on parle en général quand on parle du génome d'un eucaryote (animal, plante, champignon, etc.) ;
  • les génomes non-nucléaires, contenus dans des organites :

- le génome mitochondrial, contenu dans les mitochondries, chez la quasi totalité des eucaryotes ;

- le génome chloroplastique, contenu dans les chloroplastes, chez les algues et les plantes supérieures.

Chez quelques eucaryotes (par exemple la levure) sont aussi présents des plasmides (de taille réduite).

Chez l'homme en particulier (organisme eucaryote), le génome nucléaire est réparti sur 46 chromosomes, soit 22 paires d'autosomes et deux gonosomes (XX chez la femme, XY chez l'homme). Il ne faut pas confondre le génome et le caryotype, qui caractérise les chromosomes.

Taille du génome

La taille du génome se mesure en nombre de nucléotides, ou bases. La plupart du temps, on parle de pb (pour paire de bases, puisque la majorité des génomes est constituée de doubles brins d'ADN ou bien d'ARN). On emploie souvent les multiples kb (pour kilo-base) ou Mb (méga-base), qui valent respectivement 1 000 et 1 000 000 bases. La taille du génome peut aussi être exprimée en pg (pico-grammes), ce qui correspond à la masse d'ADN (haploïde) par cellule. 1 pg représente environ 1 000 Mpb.

La taille du génome peut varier de quelques kilo-bases chez les virus à plusieurs centaines de milliers de Mb chez certains eucaryotes. La quantité d'ADN, contrairement à ce qui a été longtemps supposé, n'est pas proportionnelle à la complexité d'un organisme. Les urodèles, les dipneustes, certaines fougères ont des génomes plus de 10 fois plus grands que le génome humain. Ce constat est fréquemment appelé paradoxe de la valeur C.

A ce jour, la plante herbacée Paris japonica a le plus grand génome connu : il comporte près de 150 milliards de paires de bases, soit près de 50 fois la taille du génome humain[1]

Certaines amibes, comme Amoeba dubia pourraient avoir un génome encore plus grand, jusqu'à 200 fois plus grand que celui d' Homo sapiens. Cette détermination est toutefois contestée et pourrait être faussée par le fait que ces organismes unicellulaires phagocytent un grand nombre d'autres microorganismes dont elles ingèrent les chromosomes, ce qui vient contaminer la détermination de leur contenu en exact en ADN[1].

Contenu des génomes

Les génomes sont constitués de régions codantes, qui correspondent aux gènes, et des régions non-codantes. Les régions non-codantes sont constituées des segments intergéniques et des introns à l'intérieur des gènes. Lorsque la taille du génome augmente (voir section précédente), la proportion du génome qui correspond aux régions codantes diminue. On observe une augmentation de la longueur des introns ainsi que des régions intergéniques.

Le nombre des gènes dans le génome des organismes vivants varie beaucoup moins que la taille du génome. Chez la plupart des organismes vivants il est compris entre 1 000 et 40 000. Il n'est pas non plus corrélé à la complexité apparente des organismes. La paramécie, organisme cilié unicellulaire, possède ainsi un génome contenant plus de gènes que celui de l'homme[2]. Le tableau suivant donne la taille du génome et le nombre de gènes présents chez un certain nombre d'organismes entièrement séquencés.

Organisme Nombre de gènes Taille du génome
Haemophilus influenzae (bactérie) 1 800 1,8 Mpb
Escherichia coli (bactérie) 4 300 4,6 Mpb
levure de bière 6 000 12,1 Mpb
Drosophile (insecte) ~14 500 150,0 Mpb
Nématode ~21 000 110,0 Mpb
Arabette (plante à fleur) ~25 500 110,0 Mpb
Souris ~22 000 2700,0 Mpb
Homme ~22 000 3400,0 Mpb
Paramécie ~40 000[2] 72,0 Mpb

Une grande partie des régions non-codantes est constituées de séquences répétées et plus particulièrement de répétitions dispersées. Leur proportion augmente aussi avec la taille du génome.

Annotation des génomes

L’annotation d’un génome consiste à traiter l’information brute contenue dans la séquence dans le but :

  1. de prédire, le contenu en gènes, la position des gènes à l’intérieur d’un génome (le début, la fin, et chez les eucaryotes, les introns et les exons), ainsi que leur organisation (gènes uniques ou en opéron, avec des séquences promotrices, des terminateurs, des sites de fixation ribosomiques (RBS) …). Dans ce cas, on parle d’annotation structurale.
  2. de prédire la fonction potentielle de ces gènes (leur attacher une étiquette, portant leur nom probable, leur fonction probable, leurs interactions probables). Dans ce cas on parle d'annotation fonctionnelle.

Deux types d’annotations

  • L'annotation peut être automatique c'est-à-dire s’appuyer uniquement sur des algorithmes recherchant des similarités (de séquence, de structure, de motifs, …), permettant de prédire (en fait deviner) la fonction d’un gène. Elle aboutit au transfert « automatique » de l’information figurant dans l’étiquette d’un gène « similaire » d’un génome déjà annoté au génome en cours d’annotation
  • L'annotation automatique est parfois complétée par une annotation manuelle par des experts qui valident ou invalident la prédiction en fonction de leurs connaissances ou de résultats expérimentaux. Celle-ci peut ainsi éviter le transfert automatique d’erreurs et donc leur propagation, ce qui peut devenir le grand problème que devra confronter la génomique, compte tenu de l'afflux massif de données issues en particulier, des nouvelles techniques de séquençage (voir pyroséquençage).

Notes et références

  1. a et b J. Pellicer, M. Fay, I. J. Leitch, « The largest eukaryotic genome of them all? », Botanical Journal of the Linnean Society, vol. 164, pp. 10–15 (2010).
  2. a et b (en) Aury, Jaillon et Duret et al., « Global trends of whole-genome duplications revealed by the ciliate Paramecium tetraurelia. », Nature, vol. 444, {{Article}} : paramètre « date » manquant, p. 171-178 (PMID 17086204)

Voir aussi

Sur les autres projets Wikimedia :

Bibliographie

  • Terence A. Brown, Génomes, Flammarion médecine-sciences, 2004.
  • Génétique, gènes et génomes : Cours et questions de révision, ouvrage collectif par Jean-Luc Rossignol, Roland Berger, Jean Deutsch, Marc Fellous, Dunod, 2004.
  • Stuart J. Edelstein, Des gènes aux génomes, Odile Jacob, 2002.

Articles connexes

Liens externes

Filmographie