Génome

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 19 décembre 2008 à 21:11 et modifiée en dernier par 85.28.124.207 (discuter). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
De l'ADN à la vie.

Le génome est l'ensemble du matériel génétique d'un individu ou d'une espèce encodé dans son ADN (à l'exception de certains virus dont le génome est porté par des molécules d'ARN). Il contient en particulier toutes les séquences codantes (traduites en protéines) et non-codantes (transcrites en ARN, non traduites).

La science qui étudie le génome est la génomique.

Les génomes dans le monde vivant

Chez les virus, le génome est contenu soit dans une (ou plusieurs) molécule(s) d'ADN ou d'ARN, à simple ou double brin.

Chez les procaryotes (bactéries et archées), on distingue le génome chromosomique, contenu dans une molécule d'ADN généralement circulaire, et le génome extrachromosomique, contenu dans des plasmides et des épisomes.

Chez les eucaryotes, on distingue :

  • le génome nucléaire, contenu dans le noyau qui caractérise les eucaryotes. C'est de ce génome dont on parle en général quand on parle du génome d'un eucaryote (un animal, une plante, un champignon) ;
  • les génomes non-nucléaires, contenus dans des organites :
  • le génome mitochondrial, contenu dans les mitochondries, chez la plupart des eucaryotes ;
  • le génome chloroplastique, contenu dans les chloroplastes, chez les plantes et les algues eucaryotes.

Chez quelques eucaryotes (par exemple la levure) sont aussi présents des plasmides (de taille réduite).

Chez l'homme en particulier (organisme eucaryote), le génome nucléaire est réparti sur 46 chromosomes, soit 22 paires d'autosomes et deux gonosomes. Il ne faut pas confondre le génome et le caryotype, qui caractérise les chromosomes.

Taille du génome

La taille du génome se mesure en nombre de nucléotides, ou bases. La plupart du temps, on parle de pb (pour paire de bases, puisque la majorité des génomes est constituée de doubles brins d'ADN ou bien d'ARN). On emploie souvent les multiples kb (pour kilo-base) ou Mb (méga-base), qui valent respectivement 1 000 et 1 000 000 bases. La taille du génome peut aussi être exprimée en pg (pico-grammes), ce qui correspond à la masse d'ADN (haploïde) par cellule. 1 pg représente environ 1 000 Mpb (978 Mpb précisément).

La taille du génome peut varier de quelques kilo-bases chez les virus à plusieurs centaines de milliers de Mb chez certains eucaryotes. La quantité d'ADN, contrairement à ce qui a été longtemps supposé, n'est pas proportionnelle à la complexité d'un organisme ; ainsi, l'amibe Amoeba dubia, un organisme unicellulaire, a un génome environ 200 fois plus grand que Homo sapiens. Ce constat est fréquemment appelé paradoxe de la valeur C.

Organisme Taille du génome (Mpb) Nombre de gènes protéiques estimés
Virus Virus de la grippe 0,013
Bactériophage λ 0,05
Bactériophage T4 0,165
Mimivirus 1,2 1260
Bactéries Mycoplasma pneumoniae 0,816 689
Pelagibacter ubique 1,3 1354
Haemophilus 1,8 1657
Staphylococcus aureus 2,8 2619
Bacillus subtilis 4,2 4106
Escherichia coli 4,64 4243
Archaea Nanoarchaeum equitans 0,49 536
Pyrococcus abyssi 1,77 1898
Sulfolobus solfataricus 3 2977
Eucaryotes Encephalitozoon cuniculi 2,9 1996
Saccharomyces cerevisiae (levure) 12 5863
Plasmodium falciparum 21,8 5314
Caenorhabditis elegans (nématode) 100 22 628
Drosophila melanogaster (insecte) 118 16 548
Arabidopsis thaliana (plante) 119 28 159
Populus trichocarpa (peuplier) 485 45 500
Zea mais (maïs) 5 000
Mus musculus (souris) 3 400 30 000
Homo sapiens (homme) 3 400 26 517
Amoeba dubia 675 000

Le génome humain était estimé à un peu plus de 30 000 gènes. Cette estimation a été revue à la baisse par la suite, et est actuellement estimée à environ 20 500 - un peu moins que la plante Arabidopsis thaliana (27 000 gènes).

La séquence complète du dernier chromosome dans le génome humain (chromosome 1, le plus grand, contenant à lui seul 8% de ce génome) a été obtenue en mai 2006.

L'annotation des génomes

L’annotation d’un génome consiste à traiter l’information brute contenue dans la séquence dans le but :

  1. de prédire, le contenu en gènes, la position des gènes à l’interieur d’un génome (le début, la fin, et chez les eucaryotes, les introns et les exons), ainsi que leur organisation (gènes uniques ou en opéron, avec des séquences promotrices, des terminateurs, des sites de fixation ribosomaux (RBS) …). Dans ce cas, on parle d’annotation structurale.
  2. de prédire la fonction potentielle de ces gènes (leur attacher une étiquette, portant leur nom probable, leur fonction probable, leurs interactions probables). Dans ce cas on parle d'annotation fonctionnelle .

Les 2 types d’annotations

  • L’annotation peut être automatique c'est-à-dire s’appuyer uniquement sur des algorithmes recherchant des similarités (de séquence, de structure, de motifs, …), permettant de prédire (en fait deviner) la fonction d’un gène. Elle aboutit au transfert « automatique » de l’information figurant dans l’étiquette d’un gène « similaire » d’un génome déjà annoté au génome en cours d’annotation
  • L’annotation automatique est parfois complétée par une annotation manuelle par des experts qui valident ou invalident la prédiction en fonction de leurs connaissances ou de résultats expérimentaux. Celle-ci peut ainsi éviter le transfert automatique d’erreurs et donc leur propagation, ce qui peut devenir le grand problème que devra confronter la génomique, compte tenu de l'afflux massif de données issues en particulier, des nouvelles techniques de séquençage (voir pyroséquençage).

Notes et références

Voir aussi

Sur les autres projets Wikimedia :

Articles connexes

Liens externes

Bibliographie

Filmographie