Métagénomique


Février 2016


Bérénice Batut
berenice.batut@udamail.fr
# Pourquoi la métagénomique?
### Ecosystèmes microbiens - Majeure partie de la biomasse sur Terre - 90% des cellules d'un être humain - Colonisation de la plupart des niches écologiques
### Métagénomique ![](images/metagenomique/metagenomique.png)
### Métagénomique Compréhension du rôle écologique, du métabolisme et de l'histoire évolution d'un cosystème
### Métagénomique - Pas de culture nécessaire - Identification pour un écosystème - Micro-organismes (composition) - Gènes - Fonctions métaboliques
### Projets métagénomiques - 2 165 [projets sur NCBI](http://www.ncbi.nlm.nih.gov/bioproject/?term=metagenomic) (Janvier 2016) - Sable de plage - Moustique - Corail - Glace - Air de la ville de Singapour - Surface de la cuvette des toilettes - Fromages - ...
# Principes de la métagénomique
### Métagénomique ![](images/metagenomique/principe_metagenomique.png)
### Métagénomique Objectifs: - Identifier les organismes présents dans un échantillon - Identifier les fonctions principales réalisés par les organismes d'un échantillon
## Extraction et séquençage
### 2 types d'expériences métagénomiques - Amplicon - "Envionmental shotgun metagenomics", WGS ou métagénomique
### "Envionmental shotgun metagenomics", WGS ou métagénomique Séquençage de l'ensemble des séquences d'un échantillon
## Prétraitements
### Prétraitements - Contrôle de la qualité des séquences - Assemblage - Tri des séquences - Prédiction des séquences d'intérêt
### Tri des séquences - Utilité - Assignation des séquences - Recherche dans des bases de données spécifiques - Caractéristiques d'intérêt - Gènes ARNr, ARNt - ORF - Unités taxonomiques opérationnelles (OTU) - Quelques outils - SortMeRNA, rRNA selector - MetaGeneAnnotator, Prodigal, Orphelia - tRNAscanSE
## Affiliation taxonomique des séquences
### Pourquoi l'affiliation taxonomique? ![](images/metagenomique/TS1.svg)
### Pourquoi l'affiliation taxonomique? ![](images/metagenomique/species_genus_family.png)
### Procédure standard ![](images/metagenomique/affiliation_taxonomique.png)
### Limites - Longueur des séquences - Nombre de séquences - Absences d'homologues dans les banques - Faible abondance des marqueurs phylogénétique classiques - Boues d'épuration : 0.17% - Mer des Sargasses : 0.06% - Sol acide, mines du Minnesota : 0.017%
### Recherche de similarité - Recherche de similarité par fréquence de k-mer - Recherche de similarité intrinsèques - Contenu en GC - Usage des codons
### Analyse de la diversité d'un échantillon Alpha diversité - Notion définie par *Whittaker, Evolution and Measurement of Species Diversity, 1972* - Mesure pour un échantillon de - Richesse - Nombre de groupes d'individus génétiquement liés (nombre d'espèces) - Egalité - Proportion d'espèces présentes ![](images/metagenomique/diversite_alpha.png)
## Affiliation fonctionnelle
### Pourquoi l'affiliation fonctionnelle ? ![](images/metagenomique/ts1_function.png)
### Procédure ![](images/metagenomique/affiliation_fonctionelle.png)
### Classification des fonctions protéiques - Recherche contre bases de données de références - Cluster of orthologous groups of proteins (COG) - SEED - Kyoto Encyclopedia of Genes and Genomes (KEGG) - ... - Recherche de motifs fonctionnels - InterPro - Prosite - ...
## Quelques pipelines
## Exemple [Lean human gut](https://www.ebi.ac.uk/metagenomics/projects/SRP000319/samples/SRS000998/runs/SRR029687/results/versions/1.0#ui-id-6)
## Importance des métadonnées
### Que sont les métadonnées? Description en profondeur et contrôlée de l'échantillon - Où? - Latitude et longitude - Profondeur - ... - Quand? - Quoi? - Comment? - Processus de conservation - Méthode d'extraction - Plateforme de séquençage - ...
### Importance des métadonnées Indispensable pour partager et intégrer les données dans la communauté Besoin d'un vocabulaire standardisé minimal
### Genome Standard Consortium (GSC) Organisme international, ouvert, formé en 2005 Objectifs - Promouvoir les mécanismes de standardisation de la description des génomes - Promouvoir l'échange et l'intégration des données génomiques
### Genome Standard Consortium (GSC) Missions - Développement - de nouveaux standards (méta)génomiques - des méthodes de capture et d'échange des métadonnées - Harmonisation de la collection des métadonnées et des efforts d'analyse à travers toute la communauté génomique
### Standards des métadonnées **MixS** : Minimum Information about any Sequence **MIGS/MIMS** : Minimum information about a (Meta)Genome Sequence **MIMARKS** : Minimum Information about a MARKer gene Sequence
# Métagénomique comparative [*Turnbaugh et al, Nature, 2009*](http://www.nature.com/nature/journal/v457/n7228/full/nature07540.html) Note: A core gut microbiome in obese and lean twins Données pour les TP
## Comparaison de la diversité
## Comparaison des fonctions réalisées
# Limites et freins
## Conservation des données
### Données - Besoin d'une profondeur de séquençage importante en métagénomique - Augmentation exponentielle des données générées - Limites des transferts des données par les réseaux informatiques Note: - 2-10 To de données / laboratoire / an - Plus rapide d'envoyer un disque que de récupérer par téléchargement?
### Conservation des données - Quoi? - Données brutes - Résultats des analyses - Description des données - Où? - Localement? - Cloud? - Dépôts publics? Note: - Temps d'analyses peu couteux donc pas besoin de garder tous les résultats intermédiares - Importance de la description des données - Conservation locale - risque de perte des données - confidentialité
### Principaux dépôts publics - EBI : ENA, EBI metagenomics,... - NCBI - DDBJ Note: - ENA - métadonnées complets suivants les standards - outils intuitifs, checklist, support, ... - NCIB - metadonnées suivant les standards encouragés - DDBJ - pas besoin de suivre les standard GSC
## Traitement des données