BIMM:Module Phylogénie et Evolution. Vous devez envoyer un fichier pdf ou une archive tar avec vos resultats avant Minuit le Dimanche 22 Novembre, 2009 au courrier electronique: sp point holmes at gmail.com, ou vous remplacerez point par . et at par @.
Sujet d'examen: Etudes de sequences rbcL décrites dans l'article de Delwiche et Palmer, 1996, MBE, pages 873--882:
  • (Partie I) Sequences ADN: Le fichier all3types.fasta contient des séquences d'ADN dont on voudrait faire l'arbre phylogenétique. Il faudra éditer un peu le fichier pour que les abbréviations en 10 lettres des noms soient unique si vous voulez utiliser des programmes qui prennent le format Phylip en entrée.
    1. Aligner les sequences, sauver avec un format compatible avec les programmes d'estimation d'arbre.
    2. Utiliser trois types d'estimation differentes pour faire l'estimation des arbres. Montrer les resultats en format Newick et comme des graphiques d'arbres faits avec ape.
    3. Justifiez et expliquez les choix de parametres que vous faites dans vos analyses.
    4. Utiliser le bootstrap ou des mesures de confiance Bayesiennes pour evaluer la confiance qu'on peut avoir en ces arbres.
  • (Partie II) Sequences d'Acides Amines:
    Le fichier rbclAA.nex qui vient de fichier original nex contient les acides amines au format nexus.
    Vous pouvez les utiliser tel quel ou les transformer au format fasta en format phylip, un exemple parmi beaucoup: http://myhits.isb-sib.ch/cgi-bin/reformat
    Utiliser ce site pour créer un fichier compatible avec phylip a partir de l'alignement fasta des acides aminés.
    1. Utiliser deux methodes de construction d'arbre différentes sur les donnes d'acides aminés. Faites des graphiques. Commenter les différences entre les arbres obtenus avec deux methodes différentes.
    2. Commentez les différences entre les résultats obtenus dans (I) avec les sequences d'ADN et ceux obtenus dans cette partie.
  • Remarques:
    1. Montrer tout votre travail et adjoindre les fichiers intermédiaires principaux, (pas les fichiers bootstrapes ou les simulations trop gros).
      Tout votre travail devra etre individuel donc je ne m'attends pas a voir exactement les memes noms, les memes résultats dans vos sorties.
    2. Interpretez autant que possible vos résultats en comparant les sorties obtenues par les différentes méthodes.
    3. Si vous avez des problemes avec le reformattage, un exemple de fichier en format phylip est fourni ici (mais attention aux noms qui devront etre edite): rbc40.phy .
      Le fichier des acides amines reformats en format fasta est ici: rbcl.fasta . Le fichier des acides amines reformats en format phylip est ici: rbcl.phylip .
    4. La seule chose que vous devez absolumment faire avec R est de faire de graphiques de bonne qualite (utiliser le package ape comme en TD).