Si vous voyez ce message, cela signifie que nous avons des problèmes de chargement de données externes.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Construire un arbre phylogénétique

La logique derrière les arbres phylogénétiques. Comment construire un arbre en se basant sur des caractéristiques présentes ou absentes dans un groupe d'organismes ?

Les points clés :

  • Les arbres phylogénétiques représentent des hypothèses sur les relations évolutives entre un groupe d'organismes.
  • Un arbre phylogénétique peut être construit en utilisant des caractéristiques morphologiques (forme corporelle), biochimiques, comportementales ou moléculaires d'espèces ou d'autres groupes.
  • En composant un arbre, on organise des espèces en groupes imbriqués sur la base du partage de caractères dérivés (traits qui diffèrent de ceux de l'ancêtre du groupe).
  • Les séquences de gènes ou de protéines peuvent être comparées entre les espèces et utilisées pour construire des arbres phylogénétiques. Les espèces proches présentent généralement peu de différences de séquence, alors que les espèces moins apparentées tendent à en avoir davantage.

Introduction

Nous sommes tous apparentés. Et je ne parle pas seulement de nous, les humains, même si c'est aussi le cas ! Tous les êtres vivants sur Terre descendent d'un ancêtre commun. N'importe quel petit groupe d'espèces descend aussi d'un ancêtre commun, souvent beaucoup plus récent.
Étant donné que l'on ne peut pas remonter dans le temps et voir comment les espèces ont évolué, comment peut-on comprendre ce qui les lie entre elles ? Dans cet article, nous allons examiner les méthodes et la logique de base utilisées pour construire des arbres phylogénétiques, ces arbres qui représentent l'histoire évolutive et les relations d'un groupe d'organismes.

Aperçu des arbres phylogénétiques

Dans un arbre phylogénétique, les espèces d'intérêt se trouvent aux extrémités des branches de l'arbre. Les branches elles-mêmes se connectent de façon à représenter l'histoire évolutive des espèces, c'est-à-dire comment elles ont évolué à partir d'un ancêtre commun à travers une série d'événements de divergence (séparation en deux). À chaque point de ramification figure l'ancêtre commun le plus récent partagé par toutes les espèces qui descendent de ce point de branchement. Les lignes de l'arbre représentent une longue série d'ancêtres qui s'étendent d'une espèce à l'autre.
Image modifiée depuis Taxonomy and phylogeny : Figure 2* par Robert Bear et al., CC BY 4.0
Pour une explication plus détaillée, consultez l'article sur les arbres phylogénétiques.
Même si vous êtes à l'aise pour lire un arbre phylogénétique, vous vous demandez peut-être : comment construit-on l'une de ces choses ? Dans cet article, on va regarder de plus près comment sont structurés les arbres phylogénétiques.

L'idée fondatrice de la construction d'arbres

Comment construit-on un arbre phylogénétique ? Le principe de base provient de l’idée de "descendance avec modification" de Darwin. Fondamentalement, en regardant le profil des modifications (nouveaux traits) chez les organismes actuels, on peut lever le voile — ou du moins élaborer des hypothèses — sur leur descendance à partir d'un ancêtre commun.
À titre d'exemple, considérons l'arbre phylogénétique ci-dessous (qui montre l'histoire évolutive d'un groupe imaginaire d'espèces de souris). On remarque que trois nouveaux traits apparaissent à différents moments de l’histoire évolutive du groupe : une queue touffue, de grandes oreilles et des moustaches. Chaque nouveau caractère est partagé par toutes les espèces qui descendent de l'ancêtre chez lequel le trait a émergé (indiqué par un tiret), mais il n'existe pas chez les espèces qui ont divergé avant l'apparition du caractère.
Quand on construit des arbres phylogénétiques, les traits qui surviennent au cours de l'évolution d'un groupe et qui diffèrent des ceux de l'ancêtre du groupe sont appelés les caractères dérivés. Dans notre exemple, une queue touffue, de grandes oreilles et des moustaches sont des traits dérivés, alors qu'une fine queue, de petites oreilles et l'absence de moustaches sont des caractères ancestraux. Un point important à soulever est qu'un trait dérivé peut apparaître par perte ou gain d'une caractéristique. Par exemple, s'il y avait un autre changement dans la lignée E qui entraînait la perte de la queue, le trait "sans queue" serait considéré comme un caractère dérivé.
Les caractères dérivés, partagés entre les espèces ou les autres groupes au sein d'un ensemble de données, sont essentiels pour nous aider à construire des arbres. Comme indiqué ci-dessus, les traits dérivés partagés constituent souvent des profils imbriqués qui fournissent des informations sur les moments où des événements de ramification sont survenus au cours de l'évolution de l'espèce.
Quand on élabore un arbre phylogénétique à partir d'une base de données, l'objectif est d'utiliser les caractères dérivés partagés par les espèces actuelles pour en déduire le schéma d'embranchement de leur histoire évolutive. Néanmoins, on ne peut pas observer l’évolution de nos espèces d’intérêt et relever quand de nouveaux traits surviennent dans chaque lignée.
C'est pourquoi on doit travailler en remontant le temps. Cela signifie que l'on doit examiner nos espèces d'intérêt (comme A, B, C, D et E) et déterminer quels traits sont ancestraux et lesquels sont dérivés. Ensuite, on utilise les traits dérivés partagés pour organiser les espèces en groupes imbriqués comme ceux représentés ci-dessus. Un arbre fabriqué de cette manière figure une hypothèse sur l’histoire évolutive des espèces. Typiquement, il s'agit du schéma d'embranchement le plus simple possible qui puisse expliquer leurs caractères.

Exemple : construire un arbre phylogénétique

Si nous étions des biologistes en train de construire un arbre phylogénétique dans le cadre de nos recherches, il faudrait sélectionner un ensemble d'organismes à classer dans cet arbre. On devrait également choisir les caractères de ces organismes sur lesquels baser notre arbre (parmi une multitude de caractéristiques physiques, comportementales et biochimiques différentes).
Par contre, si on réalise un arbre phylogénétique plutôt en classe (ce qui est probablement le cas des lecteurs de cet article), on reçoit en général un ensemble de caractéristiques, souvent sous la forme d'un tableau, que l'on doit convertir en un arbre. Par exemple, ce tableau montre la présence (+) ou l'absence (0) de différents traits :
TraitsLamproieAntilopeAigle à tête blancheAlligatorBar
Poumons0+++0
Mâchoires0++++
Plumes00+00
Gésier00++0
Fourrure0+000
Tableau modifié à partir de Taxonomy and phylogeny: Figure 4, par Robert Bear et al., CC BY 4.0
Ensuite, il faut déterminer quelle forme de chaque trait est ancestrale et laquelle est dérivée. Par exemple, la présence des poumons est-elle un caractère ancestral ou dérivé ? Pour rappel, un trait ancestral est celui qui devait être présent chez l'ancêtre commun de l'espèce d'intérêt. Un trait dérivé est une forme qui est probablement apparue quelque part dans une lignée qui descend de cet ancêtre.
Sans la capacité d'examiner le passé (ce qui serait utile, mais hélas, impossible), comment sait-on quels traits sont ancestraux et lesquels sont dérivés ?
  • Dans le cadre d'un devoir ou d'un test, la question à laquelle vous êtes en train de répondre peut indiquer quels traits sont dérivés ou ancestraux.
  • Si vous êtes un chercheur, vous disposez probablement de connaissances qui vous permettent d'identifier les traits ancestraux et dérivés (par exemple, d'après des fossiles).
  • On vous fournira peut-être des informations à propos d'un groupe externe, une espèce qui est plus éloignée de l'espèce d'intérêt que l'une de l'autre.
Si on vous donne un groupe externe, ce dernier peut servir d'intermédiaire pour les espèces ancestrales. On peut donc supposer que ses traits représentent la forme ancestrale de chaque caractère.
Dans notre exemple (données répétées par facilité), la lamproie, un poisson sans mâchoires qui n'a pas de véritable squelette, est notre groupe externe. Comme le montre le tableau, la lamproie ne possède aucune des caractéristiques énumérées : elle n'a pas de poumons, de mâchoires, de plumes, de gésier ou de fourrure. Sur la base de ces informations, on suppose que l'absence de ces traits est ancestrale, et que la présence de chaque caractéristique constitue un caractère dérivé.
TraitsLamproieAntilopeAigle à tête blancheAlligatorBar
Poumons0+++0
Mâchoires0++++
Plumes00+00
Gésier00++0
Fourrure0+000
Tableau modifié à partir de Taxonomy and phylogeny: Figure 4, par Robert Bear et al., CC BY 4.0
Maintenant, on peut élaborer notre arbre en regroupant les organismes en fonction de leurs caractères dérivés partagés. Pour débuter, on recherche le trait dérivé qui est partagé par le plus grand nombre d'organismes. Dans le cas présent, c'est la présence de mâchoires : tous les organismes, à l'exception de l'espèce externe (la lamproie), sont dotés de mâchoires. Ainsi, on peut commencer notre arbre en séparant la lignée de la lamproie du reste des espèces, et on place l'apparition de mâchoires sur la branche qui porte les espèces autres que la lamproie.
Image basée sur Taxonomy and phylogeny: Figure 6, de Robert Bear et al., CC BY 4.0
Ensuite, on recherche le caractère dérivé partagé par le plus grand groupe d'organismes qui suit. Il s'agit des poumons : l’antilope, l’aigle à tête blanche et l’alligator en possèdent, mais pas par le bar. À partir de ce modèle, on peut faire bifurquer la lignée du bar et placer l'apparition de poumons sur la lignée menant à l'antilope, l'aigle à tête blanche et l'alligator.
Image basée sur Taxonomy and phylogeny: Figure 6, de Robert Bear et al., CC BY 4.0
En suivant le même modèle, on cherche maintenant le trait dérivé partagé par plus grand nombre d'organismes qui suit. Il s'agit du gésier : l’alligator et l’aigle à tête blanche en ont un (et il absent chez l’antilope). Grâce à ces données, on sépare la lignée de l'antilope de la lignée de l'alligator et de l'aigle à tête blanche et on place l'apparition du gésier sur cette dernière.
Image basée sur Taxonomy and phylogeny: Figure 6, de Robert Bear et al., CC BY 4.0
Qu'en est-il de la fourrure et des plumes ? Ces caractères sont dérivés, mais ils ne sont pas partagés, car chacun ne se retrouve que chez une seule espèce. Les traits dérivés qui ne sont pas partagés ne nous aident pas à construire un arbre, mais on peut quand même les placer à la position la plus probable. Pour les plumes, c'est sur la lignée de l'aigle à tête blanche (après divergence avec celle de l'alligator). Pour la fourrure, c'est sur la lignée de l'antilope, après sa séparation avec celles de l'alligator et de l'aigle à tête blanche.
Image basée sur Taxonomy and phylogeny: Figure 6, de Robert Bear et al., CC BY 4.0

Le principe de parcimonie et les pièges lors de la construction d'arbres

Lorsqu'on construit l'arbre ci-dessus, on utilise une approche appelée la parcimonie. La parcimonie signifie essentiellement que l'on choisit l’explication la plus simple qui puisse rendre compte de nos observations. Dans le contexte de la création d'un arbre, cela implique que l'on sélectionne l'arbre qui nécessite le moins d'événements génétiques indépendants (apparitions ou disparitions de traits).
Par exemple, on pourrait aussi expliquer le profil des traits que l'on a observés grâce à l'arbre suivant :
Image basée sur Taxonomy and phylogeny: Figure 6, de Robert Bear et al., CC BY 4.0
Cette série d'événements fournit également une explication évolutionniste des caractères que l'on observe chez ces cinq espèces. Cependant, elle est moins parcimonieuse, car elle nécessite plus de changements indépendants des traits. Vu l'endroit où l'on a placé le bar, on doit émettre l'hypothèse que les mâchoires sont apparues indépendamment à deux moments différents (une fois dans la lignée du bar et une fois dans la lignée menant à l'antilope, à l'aigle à tête blanche et à l'alligator). Cela confère à l'arbre un total de 6 tirets ou événements de changement de trait, contre 5 dans l'arbre plus parcimonieux ci-dessus.
Dans cet exemple, il peut sembler assez évident qu'il existe une meilleure arborescence, et compter les tirets peut paraître inutile. Cependant, les chercheurs qui réalisent des phylogénies dans le cadre de leur travail utilisent souvent un grand nombre de caractéristiques, et les profils de ces traits correspondent rarement à 100 %. En fait, il existe des conflits, où un arbre est plus adapté au profil d'un caractère donné, alors qu'un autre arbre convient mieux au profil d'un autre trait. Dans ces cas, le chercheur a recours à la parcimonie pour choisir l'arbre (l'hypothèse) qui correspond le mieux aux données.
Vous vous demandez peut-être pourquoi les arbres phylogénétiques ne s'accordent pas tous les uns avec les autres, quels que soient les traits sur lesquels ils sont basés ? Après tout, l’évolution d’un groupe d’espèces s’est produite d’une manière particulière dans le passé. Le problème est que, lorsque l'on construit un arbre, on reconstitue cette histoire évolutive à partir de données incomplètes et parfois imparfaites. Par exemple :
  • Il se peut que l'on ne soit pas toujours en mesure de distinguer les traits qui reflètent le partage d'un ancêtre (caractères homologues) de ceux qui sont similaires, mais qui sont apparus indépendamment (caractères analogues issus d'une évolution convergente).
  • Des caractères peuvent être gagnés et perdus à de multiples reprises au cours de l'histoire évolutive d'une espèce. Une espèce peut disposer d'un trait dérivé, mais perdre ensuite cette caractéristique (revenir à la forme ancestrale) au cours de l’évolution.
Les biologistes se servent souvent de nombreuses caractéristiques différentes pour construire des arbres phylogénétiques à cause de ce type de sources d'erreurs. Même lorsque tous les traits sont soigneusement choisis et analysés, il est toujours possible que certains d'entre eux amènent à de mauvaises conclusions (parce que l'on ne dispose pas d'informations complètes sur les événements du passé).

Utiliser des données moléculaires pour construire des arbres

Un outil qui a révolutionné (et continue de le faire) l'analyse phylogénétique est le séquençage de l'ADN. Grâce à cette possibilité, au lieu d'utiliser les caractéristiques physiques ou comportementales des organismes pour construire des arbres, on compare plutôt les séquences de leurs gènes ou de leurs protéines orthologues (liés à l'évolution).
Le principe de base d'une telle comparaison est similaire à ce que nous avons réalisé ci-dessus : il existe une forme ancestrale de la séquence de l'ADN ou des protéines, et des changements sont survenus à ces niveaux au cours de l'évolution. Cependant, un gène ou une protéine ne correspond pas seulement à une caractéristique unique qui existe sous deux états.
En fait, chaque nucléotide d'un gène ou chaque acide aminé d'une protéine peut être considéré comme une caractéristique distincte, qui peut osciller entre plusieurs états (par exemple, A, T, C ou G pour un nucléotide) par mutation. Donc, un gène composé de 300 nucléotides représente 300 différentes caractéristiques qui existent sous 4 états ! La quantité d'informations que l'on tire des comparaisons de séquences — et donc, la résolution que l'on peut espérer atteindre pour un arbre phylogénétique — est beaucoup plus élevée que lorsque l'on a recours à des caractères physiques.
Pour analyser les données de séquence et identifier l'arbre phylogénétique le plus probable, les biologistes se servent communément de programmes informatiques et d'algorithmes statistiques. Mais, souvent lorsqu'on compare les séquences d'un gène ou d'une protéine entre les espèces :
  • Un plus grand nombre de différences indique des espèces moins apparentées
  • Un plus petit nombre de différences correspond à des espèces plus étroitement apparentées
Par exemple, supposons que l'on compare la chaîne bêta de l'hémoglobine (la protéine qui transporte l'oxygène dans le sang) entre les humains et une variété d'autres espèces. Si on confronte les versions de la protéine chez l'homme et le gorille, on ne trouve qu'une différence d'1 acide aminé. Si on compare plutôt les protéines de l'homme et du chien, on repère 15 différences. Pour l'homme et le poulet, il existe 45 acides aminés différents, et pour l'homme et la lamproie (poisson sans mâchoires), on détecte 127 différences1. Ces chiffres reflètent que, parmi les espèces considérées, l’homme est plus étroitement apparenté au gorille et moins proche de la lamproie.
Vous pouvez voir Sal décrire un exemple impliquant des arbres phylogénétiques et des données de séquence dans la vidéo Questions/réponses : examen AP biologie .

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.