Les lois d’échelle prédisent la diversité microbienne mondiale. 2016. National Academy of Sciences

Scaling laws predict global microbial diversity.
Article original en anglais + manuscrit traduit en français + sources bibliographiques:
https://drive.google.com/file/d/13CKSpsxe9xhC9wvFvpPY0MN13eOXMkDB/view?usp=sharing

La compréhension de la biodiversité microbienne s’est rapidement transformée au cours de la dernière décennie.
Le séquençage de l’ADN à haut débit, et la bioinformatique ont élargi les ordres de grandeur du catalogue des taxons microbiens, tandis que la découverte de nouveaux phylums remodèle l’arbre de vie (1–3).
Parallèlement, les découvertes de nouvelles formes de métabolisme ont permis de mieux comprendre comment les microbes persistent dans pratiquement tous les écosystèmes aquatiques, terrestres, artificiels ou associés à un hôte (4, 5).
Cependant, cette période de découverte a révélé peu, voire aucune, de règles générales de prédiction de la biodiversité microbienne à des échelles d’abondance qui caractérisent, par exemple, les environ 10 puissance 14 cellules de bactéries qui habitent un seul humain, ou les environ 10 puissance 30 cellules de bactéries et archées qu’on estime habiter la Terre (6, 7).
De telles découvertes aideraient à estimer la richesse globale des espèces et révéleraient si les théories de la biodiversité sont valables à toutes les échelles d’abondance et si les soi-disant modèles de biodiversité de type « loi » couvrent l’arbre de vie.
Un objectif principal de la théorie de l’écologie et de la biodiversité est de prédire la diversité, la banalité et la rareté à travers des taxons évolutifs éloignés et des échelles d’espace, de temps et d’abondance (8–10).
Cet objectif peut difficilement être atteint sans tenir compte des organismes les plus abondants, les plus répandus et les plus diversifiés sur le plan métabolique, taxonomique et fonctionnel de la Terre (c’est-à-dire les micro-organismes).
Cependant, les tests de la théorie de la biodiversité incluent rarement des ensembles de données microbiennes et macrobiennes.
Et en même temps, l’étude de l’écologie microbienne n’a pas encore découvert de relations quantitatives qui prédisent la diversité, la banalité et la rareté à l’échelle des microbiomes hôtes et au-delà.
Ces opportunités inexplorées laissent la compréhension de la biodiversité limitée aux espèces les plus remarquables de plantes et d’animaux.
Ce manque de synthèse a également conduit à l’étude indépendante de deux phénomènes qui représentent probablement un seul modèle universel.
Plus précisément, ces phénomènes sont les distributions très inégales de l’abondance qui sous-tendent la théorie de la biodiversité (11) et le modèle universel de communité et de rareté microbiennes connu sous le nom de «biosphère rare» microbienne (12). [Note du traducteur. Je vais utiliser dans cette traduction le mot communité. J’emploies le mot communité au sens synonyme de banalité.Fin de note du traducteur.]
Les lois de mise à l’échelle offrent une voie prometteuse vers la compréhension et la prévision unifiées de la biodiversité.
Aussi appelées lois de puissance, les formes de ces relations, y environ égal à x puissance z, prédisent des taux linéaires de changement sous transformation logarithmique [c’est-à-dire log (y) environ égal à z fois log (x)] et, par conséquent, des changements proportionnels d’un ordre de grandeur à l’autre.
Les lois de mise à l’échelle révèlent comment les contraintes physiologiques, écologiques et évolutives s’appliquent aux génomes, cellules, organismes et communautés de tailles très variables (13-15).
Parmi les plus connues figurent la mise à l’échelle du taux métabolique (B) avec la taille corporelle (13) et la vitesse à laquelle la richesse en espèces (c’est-à-dire le nombre d’espèces; S) augmente avec la zone (16).
Ces lois d’échelle sont prédites par de puissantes théories écologiques, bien que les preuves suggèrent qu’elles échouent pour les micro-organismes (17–19).
Au-delà de la superficie et de la taille corporelle, il existe une contrainte tout aussi générale sur la biodiversité: le nombre d’individus dans un assemblage (N).
Souvent appelé abondance totale, N (nombre d’individus dans un assemblage) peut aller de moins de 10 individus dans une zone donnée à près de 10 puissances 30 cellules de bactéries et archées sur Terre (6, 7).
Cette étendue dépasse 22 ordres de grandeur qui séparent la masse d’une cellule d’algue Prochlorococcus (3.10 puissance −16 kg) de celle d’une baleine bleue (1,9 · 10 puissance 5 kg) et 26 ordres de grandeur entre la mesure de la surface terrestre et celle d’une bactérie (5,1 · 10 puissance 26 micromètres carrés).
Ici, nous examinons si N (nombre d’individus dans un assemblage) peut être l’une des contraintes les plus puissantes sur la banalité et la rareté et l’une des variables les plus explicites à travers lesquelles des aspects de la biodiversité pourraient évoluer.
Bien que N (nombre d’individus dans un assemblage) impose une contrainte évidente sur le nombre d’espèces (c.-à-d. S inférieur ou égal à N), des études empiriques et théoriques suggèrent que S échelonne avec N à un taux de 0,25 à 0,5 (c.-à-d., S environ égal à N puissance z et 0,25 inférieur ou égal à z inférieur ou égal à 0,5) (20–22).
Il est important de noter que cette relation s’applique aux échantillons provenant de différents systèmes et ne concerne pas les modèles cumulatifs, qui sont basés sur le rééchantillonnage (20-22).
Des études récentes ont également montré que N (nombre d’individus dans un assemblage) contraint les modèles universels de communité et de rareté en imposant une contrainte numérique sur la façon dont l’abondance varie d’une espèce à l’autre, dans l’espace et dans le temps (23, 24).
Plus particulièrement, un N (nombre d’individus dans un assemblage) plus grand conduit à des distributions de plus en plus inégales et à une plus grande rareté.
Par conséquent, nous nous attendons à ce qu’un plus grand N (nombre d’individus dans un assemblage) s’accompagne d’une distribution de plus en plus inégale parmi un plus grand nombre d’espèces, dont une part croissante devrait être rare.
Cependant, la force des relations, si elles diffèrent entre les microbes et les macrobes, et si elles sont conformes aux lois d’échelle à travers les ordres de grandeur sont pratiquement inconnues.
[Note du traducteur: D’après cette page wikipédia, macrobe est une autre manière de dire « macro-organisme ». Fin de la note du traducteur].
Si les aspects de la diversité, de la banalité et de la rareté échelonnent avec N (nombre d’individus dans un assemblage), les prévisions, de l’échelle locale à mondiale, de la biodiversité microbienne pourraient être à portée de main.
De même, si ces relations sont similaires pour les microbes et les macrobes, alors nous pourrions être plus proches d’une compréhension unifiée de la biodiversité qu’on ne le pensait auparavant.
Pour répondre à ces questions, nous avons compilé les plus grands ensembles de données microbiennes et macrobiennes accessibles au public à ce jour.
Ces données comprennent 20 376 sites de communautés fongiques bactériennes, archéennes et microscopiques et 14 862 sites de communautés d’arbres, d’oiseaux et de mammifères.
Nous nous sommes concentrés sur les aspects taxonomiques de la biodiversité, y compris la richesse en espèces (S), la similitude d’abondance entre les espèces (régularité), la concentration de N (nombre d’individus dans un assemblage) parmi les espèces à relativement faible abondance (rareté) et le nombre d’individus appartenant aux espèces les plus abondantes (dominance absolue, Nmax).
Nous utilisons les relations qui en résultent pour prédire Nmax et S dans les grands microbiomes et faire des estimations empiriquement étayées et théoriquement étayées pour le nombre d’espèces microbiennes sur Terre.
Résultats et Discussion.
Comme prévu, un N plus grand a entraîné une augmentation de la richesse, de la dominance et de la rareté des espèces et une diminution de la régularité des espèces.
La rareté, la régularité et la dominance se sont échelonnées sur sept ordres de grandeur en N (nombre d’individus dans un assemblage) à des taux qui différaient peu, voire pas du tout, entre les microbes et les macrobes (figure 1).
Nous avons constaté que la richesse en espèces (S) était plus élevée pour les microbes (z = 0,38) que pour les macrobes (z = 0,24), mais elle était tout de même proche de la plage attendue de 0,25 <= z <=0,5 (Fig. 1).
Cependant, pour un N donné, les microbes avaient une plus grande rareté, moins de régularité et plus d’espèces que les macrobes (Fig. 1).
En conséquence, les microbes et les macrobes sont similaires dans la façon dont la communité et la rareté évoluent avec N (nombre d’individus dans un assemblage), mais diffèrent par des moyens qui soutiennent la nature exceptionnelle de la biosphère microbienne rare.
La relation la plus unificatrice que nous avons observée était une mise à l’échelle isométrique précoce (c’est-à-dire, 0,9 <z <1,0) de la dominance (Nmax).
Lorsqu’elle est étendue à des échelles mondiales, cette loi d’échelle de dominance prédit étroitement l’abondance des bactéries océaniques dominantes.
En utilisant le modèle log normal de la biodiversité, les estimations publiées du N (nombre d’individus dans un assemblage) microbien mondial, et les valeurs publiées et prévues de Nmax, nous prédisons que la Terre est occupée par 10 puissance 11 à 10 puissance 12 espèces microbiennes.
Cette estimation est également soutenue par la mise à l’échelle de la richesse en espèces S avec N (nombre d’individus dans un assemblage) .
La mise à l’échelle des relations indique une biosphère rare et exceptionnelle..
Dans toutes les communautés microbiennes et macrobiennes, l’augmentation du N (nombre d’individus dans un assemblage) a conduit à une plus grande rareté, une plus grande dominance absolue, moins de régularité et une plus grande richesse en espèces (Fig. 1 et Annexe SI, Fig. S5 – S9).
Des régressions multiples bootstrap ont révélé que l’importance des différences entre les microbes et les macrobes, en ce qui concerne la rareté et la régularité, dépendait de la taille de l’échantillon.
Des échantillons plus grands suggéraient des différences significatives, mais étaient moins susceptibles de passer les hypothèses de régression multiple (Matériels et méthodes et annexe SI, Fig. S5).
Bien que basée sur des types de données disparates (c.-à-d. Dénombrements d’organismes individuels par rapport aux enquêtes moléculaires environnementales), la dominance absolue s’est étendue à des taux similaires pour les microbes et les macrobes (figure 1).
Chaque relation était mieux ajustée par une loi de puissance par opposition aux relations linéaires, exponentielles ou semi-logiques (annexe SI, tableau S1).
Depuis sa première description il y a près de dix ans (25), la biosphère rare est devenue un modèle intensivement étudié de communité et de rareté microbiennes (12).
Bien que sa forme générale réitère la nature omniprésente des communautés écologiques, nos résultats suggèrent que les communautés microbiennes sont exceptionnelles en termes de rareté et d’irrégularité.
[Note du traducteur: Afin de comprendre la phrase qui va suivre, je vous invite à prendre connaissance, dans la description sous la vidéo, de la vidéo parallèle dans laquelle j’explique la définition du mot « singleton ». Fin de la note du traducteur].
Bien que les artefacts parfois associés à des enquêtes moléculaires puissent gonfler les disparités en abondance ou générer de faux singletons,
nos résultats suggèrent que les relations de rareté, de dominance, de régularité et de richesse étaient robustes à l’inclusion ou à l’exclusion des singletons et des seuils de pourcentage différents dans la similitude de séquence (Annexe SI, Fig.
S8 et S9).
Naturellement, l’inclusion de séquences non classifiées a conduit à une richesse taxonomique plus élevée.
À la suite de cette comparaison à grande échelle, nous suggérons que la biosphère rare est motivée par la biologie et l’écologie uniques des micro-organismes.
Des exemples sont la capacité des petites populations à persister dans des environnements sous-optimaux à travers des stades de vie résilients, la capacité des microbes à se disperser sur de longues distances et à coloniser de nouveaux habitats, la capacité des microbes à cloisonner finement les axes de niche et la plus grande capacité des organismes asexués à maintenir de petites tailles de population (12 ).
Mise à l’échelle prédite de la richesse en espèces (S).
L’exposant de mise à l’échelle (z) pour la relation entre la richesse en espèces (S) et N (nombre d’individus dans un assemblage) se situait près ou dans l’intervalle prévu (c.-à-d. 0,25 < z <0,5) (20–22) (Fig. 1 et tableau 1).
Malgré la variation dans la relation entre les ensembles de données (Annexe SI, Fig. S7), la structure d’erreur entre les ensembles de données était largement symétrique (Annexe SI, Fig. S5).
Dans les ensembles de données, z (exposant de mise à l’échelle) variait plus fortement pour les macrobes (0,07–1,23) que pour les microbes (0,20–0,46), ce qui ressemblait davantage à la relation attendue (tableau 1 et annexe SI, figure S7).
Cependant, la mise en commun de toutes les données pour utiliser la gamme complète de N (nombre d’individus dans un assemblage) et faire la moyenne des idiosyncrasies entre les ensembles de données, a fourni une relation globale plus forte et produit un exposant (z = 0,51) presque identique à celui observé dans d’autres études empiriques (20–22).
[Note du traducteur: Je vous invite à consulter cette page wikipédia et cette page cnrtl concernant la définition du mot idiosyncrasies. De manière très résumée, l’idiosyncrasie, c’est le fait que certains individus possède un caractéristique individuelle qui contraste avec les caractéristiques les plus répandues dans le groupe auquel cet individu appartient. Fin de la note du traducteur].
Loi de mise à l’échelle de la dominance expansive.
Bien qu’un plus grand N entraîne naturellement une plus grande dominance absolue (Nmax) (26), cette relation est rarement explorée et, à notre connaissance, elle n’a pas été étudiée comme étant une loi d’échelle.
Nous avons constaté que Nmax était mis à l’échelle avec N à des taux similaires et presque isométriques (c.-à-d., 0,9 < z <1,0) pour les microbes et les macrobes sur sept ordres de grandeur (Fig.1) (R2 = 0,94).
Sur la base de la force de ce résultat, nous avons testé si cette loi d’échelle est valable à des échelles plus grandes de N.
Nous avons utilisé des estimations publiées pour le N (nombre d’individus dans un assemblage) et le Nmax (dominance absolue) provenant de l’intestin humain (27, 28), du rumen de la vache (29, 30), de l’océan mondial (non-sédiment) et de la Terre (6, 7, 31, 32).
Dans chaque cas, nous avons constaté que Nmax (dominance absolue) se situait dans les intervalles de prédiction de 95\% de la loi d’échelle de dominance (Fig. 2).
Bien que dérivée d’ensembles de données où n < 108, la loi d’échelle de dominance a prédit l’abondance mondiale de certaines des bactéries les plus abondantes sur Terre [Pelagibacterales (SAR11); Prochlorococcus marinus] dans un ordre de grandeur des estimations antérieures (31, 32).
En conséquence, cette loi d’échelle de dominance semble s’étendre, et c’est du jamais vu, sur 30 ordres de grandeur dans N (nombre d’individus dans un assemblage), s’étendant jusqu’aux limites supérieures d’abondance dans la nature.
La seule autre loi d’échelle biologique qui se rapproche de cette étendue est l’échelle de puissance 3/4 du pouvoir métabolique à la masse, qui est valable sur 27 ordres de grandeur (33).
Prédire la richesse en espèces (S) microbienne mondiale à l’aide de N et Nmax.
Connaître le nombre d’espèces sur Terre est l’un des plus grands défis de la biologie (34–37).
Historiquement, les scientifiques ont estimé la richesse mondiale (S) en extrapolant les courbes de raréfaction et les taux d’accumulation, souvent sans inclure les micro-organismes (36–38).
Bien qu’il existe des estimations du S (richesse en espèces) microbien mondial, elles varient de 10 puissance 4 à 10 puissance 9, reposent sur des organismes de culture, précèdent des projets de séquençage à grande échelle et sont souvent basées sur l’extrapolation d’estimateurs statistiques (par exemple, la raréfaction et le Chao [Note du traducteur: Le Chao, avec un C majuscule, et pas de « s » à la fin. Le Chao est un estimateur statistique développé en 2004 par Anne Chao. Fin de la note du traducteur].).
Ces approches manquent également des fondements théoriques qui distinguent les extrapolations d’estimations statistiques, des prédictions de la théorie de la biodiversité.
Comme approche alternative pour estimer S (richesse en espèces), nous avons tiré parti de nos relations de mise à l’échelle avec un modèle bien établi de biodiversité.
Sur la base de la mise à l’échelle de S (richesse en espèces) avec N (nombre d’individus dans un assemblage) (Fig. 1), nous nous attendrions à un S (richesse en espèces) mondial microbien de 2,1 ± 0,14 fois 10 puissance 11 espèces.
Cependant, ce type d’exercice risqué extrapolerait 26 ordres de grandeur au-delà des données disponibles (Fig. 2).
Au lieu de cela, nous avons utilisé la loi d’échelle de dominance et l’un des modèles de biodiversité les plus réussis (c’est-à-dire la distribution log normale) pour faire une prédiction théoriquement étayée du S (richesse en espèces) microbien mondial (35, 39).
Le log-normal prédit que la distribution de l’abondance entre les espèces, est à peu près normale lorsque l’abondance des espèces est transformée en log (20).
Une extension du théorème central des limites, la log-normale résulte des interactions multiplicatives de nombreuses variables aléatoires (20, 39).
Bien qu’historiquement utilisé pour prédire les schémas de communité et de rareté, le log-normal a ensuite été dérivé pour prédire S (richesse en espèces) en utilisant N (nombre d’individus dans un assemblage) et Nmax (dominance absolue) (35).
Cette dérivation de la log-normale a conduit à des prédictions de S (richesse en espèces) pour des habitats dont la taille varie d’un millilitre d’eau à un lac entier et à des spéculations de S (richesse en espèces) pour l’ensemble de l’océan.
À notre connaissance, la log-normale est le seul modèle général de biodiversité qui a été dérivé pour prédire S (richesse en espèces) en utilisant uniquement N (nombre d’individus dans un assemblage) et Nmax (dominance absolue) en valeur d’entrées.
Nous avons utilisé la log-normale pour prédire le S (richesse en espèces) microbien de deux manières.
Tout d’abord, nous avons utilisé des estimations publiées de N (nombre d’individus dans un assemblage) et prédit les valeurs de Nmax (dominance absolue) en utilisant notre loi d’échelle de dominance (Fig. 2).
Deuxièmement, nous avons fait des prédictions de S (richesse en espèces) en utilisant des estimations publiées de N (nombre d’individus dans un assemblage) et Nmax (dominance absolue) (6,7, 31, 32).
En supposant que le N (nombre d’individus dans un assemblage) microbien mondial varie de 9,2 fois 10 puissance 29 à 3,2 fois 10 puissance 30 (6, 7), la log-normale prédit 3,2 ± 0,23 fois 10 puissance 12 espèces lorsque Nmax (dominance absolue) est prédit à partir de la loi d’échelle de dominance (Matériels et méthodes).
Cependant, en utilisant des estimations publiées pour Nmax allant de 2,9 fois 10 puissance 27 à 2,4 fois 10 puissance 28 (31, 32), le modèle log-normal prédit une valeur de S (richesse en espèces) microbien mondial qui est du même ordre de grandeur que la relation d’échelle richesse-abondance (c’est-à-dire 3,9 ± 0,05 fois 10 puissance 11 espèces) (Fig. 3).
L’accord général entre le modèle log-normal et la relation d’échelle de richesse est encourageant étant donné la magnitude de ces prédictions.
Nos prédictions de S (richesse en espèces) pour les grands microbiomes sont parmi les plus rigoureuses à ce jour, résultant des intersections de l’échelle empirique, de la théorie écologique et des plus grandes enquêtes moléculaires jamais réalisées sur les communautés microbiennes.
Cependant, plusieurs mises en garde doivent être prises en compte.
Premièrement, la S (richesse en espèces) observée pour le Earth Microbiome Project (EMP) différait considérablement selon que nous utilisions des données référencées ouvertes ou fermées (Matériels et méthodes), où S était respectivement de 6,9 ​​fois 10 puissance 4 et 5,6 fois 10 puissance 6.
Dans notre étude principale, nous avons utilisé les données de référence fermées en raison de la plus grande précision de cette approche, et du fait que 42\% de tous les taxons de l’ensemble de données de référence ouvert du Earth Microbiome Project (EMP) n’ont été détectés que deux fois ou moins.
Par conséquent, des choix, tels que la manière d’attribuer des unités taxonomiques opérationnelles (OTU) et les amorces ou régions génétiques à utiliser, doivent être faits avec prudence ou délibérément.
Deuxièmement, les estimations de Swill sont beaucoup plus élevées que celles observées lorsque de nombreuses espèces ne sont détectées qu’une ou deux fois, comme avec le Earth Microbiome Project (EMP).
Les estimateurs statistiques de S (richesse en espèces), tels que la raréfaction, le jackknife, le Chao, etc., sont déterminés par des singletons et des doubletons (26).
[Note du traducteur: D’après la page wikipédia correspondante, en statistique, le jackknife (équivalent anglais du mot français couteau-suisse) est une méthode de rééchantillonnage qui tire son nom du couteau suisse du fait qu’elle peut être utile à diverses choses. Fin de la note du traducteur].
Troisièmement, il est difficile d’estimer la part des espèces manquées lorsqu’une infime fraction de tous les individus est échantillonnée.
Par exemple, l’intersection du modèle log-normal et de la relation d’échelle de richesse suggère que S (richesse en espèces) pour un intestin humain individuel pourrait varier de 10 puissance 5 à 10 puissance 6 espèces (Fig. 3).
Cependant, S (richesse en espèces) des échantillons d’intestin humain est souvent de l’ordre de 10 puissance 3, alors que N (nombre d’individus dans un assemblage) est souvent inférieur à 10 puissance 6.
Ces tailles d’échantillon sont des fractions extrêmement petites du microbiome intestinal, même lorsque de nombreux échantillons sont compilés ensemble.
Par exemple, la compilation des 4 303 échantillons de l’ensemble de données du Earth Microbiome Project (EMP) ne produit que 2,2 fois 10 puissance 7 relevés, ce qui est à peine suffisant pour détecter 10 puissance 5 à 10 puissance 6 espèces parmi 10 puissance 14 cellules.
Par conséquent, la détection du vrai S (richesse en espèces) des microbiomes avec un grand N (nombre d’individus dans un assemblage) est un défi de taille qui nécessite de nombreux et grands échantillons.
Conclusion.
Nous estimons que la Terre est habitée par 10 puissance 11 à 10 puissance 12 espèces microbiennes.
Cette prédiction est basée sur une théorie écologique reformulée pour des prédictions à grande échelle, une loi d’échelle de dominance expansive, une relation d’échelle de richesse avec un support empirique et théorique, et les plus grandes enquêtes moléculaires compilées à ce jour.
La magnitude profonde de nos prévisions sur la diversité microbienne de la Terre souligne la nécessité de poursuivre les recherches.
Nous nous attendons à ce que la loi d’échelle de dominance que nous avons découverte, soit précieuse pour prédire la richesse, la communité et la rareté à toutes les échelles d’abondance.
Pour aller de l’avant, les biologistes devront aller au-delà des limites de calcul actuelles et accroître leurs investissements dans les efforts d’échantillonnage collaboratif pour cataloguer la diversité microbienne de la Terre.
Pour rappel, environ 104 espèces ont été cultivées, moins de 105 espèces sont représentées par des séquences classées, et l’intégralité du Earth Microbiome Project (EMP) a catalogué moins de 107 espèces, dont 29\% n’ont été détectées que deux fois.
Des relations puissantes comme celles documentées ici et une plus grande étude unifiée de la communité et de la rareté contribueront grandement à trouver les 99,999\% de taxons microbiens qui restent encore non découverts à ce jour.
Matériels et méthodes.
Données.
Nos ensembles de données macrobiennes comprenaient 14 862 sites différents de communautés de mammifères, d’arbres et d’oiseaux.
Nous avons utilisé une compilation de données concernant l’abondance des espèces pour les communautés réparties sur tous les continents, à l’exception de l’Antarctique (40).
Cette compilation est basée, en partie, sur cinq enquêtes de l’échelle continentale à mondiale: United States Geological Survey (USGS) North American Breeding BirdSurvey (41) (2769 sites), citizen science Christmas Bird Count (42) (1 412 sites), Forest Inventory Analysis (43) (10 356 sites), Alwyn Gentry’s Forest Transect DataSet (ensemble de données du transect forestier d’Alwyn Gentry) (44) (222 sites) et une compilation de données à l’échelle mondiale: the Mammal Community Database, la base de données de la communauté des mammifères (45) (103 sites).
Nous avons limité notre ensemble de données sur le Christmas Bird Count (dénombrement des oiseaux de Noël) aux sites où N n’était pas supérieur à 104 (c.-à-d. Le N (nombre d’individus dans un assemblage) maximal signalé pour le North American Breeding Bird Survey).
Au-dessus de cette valeur, les estimations de N ne sont probablement pas basées sur le nombre d’individus.
Aucun site n’est représenté plus d’une fois dans nos données.
Plus de détails peuvent être trouvés ailleurs (annexe dans la réf. 40).
Nous avons utilisé 20 376 sites de communautés de bactéries, archées et champignons microscopiques; 14 615 d’entre eux provenaient du Earth Microbiome Project (EMP) (1) obtenu le 22 août 2014.
Le traitement des échantillons, le séquençage et les données d’amplicon sont normalisés et exécutés par Earth Microbiome Project (EMP), et tous sont accessibles au public sur qiita.microbio.me.
[Note du traducteur. Un amplicon, c’est un fragment d’ADN qui est amplifié, lors de la technique de la PCR, réaction en chaîne par polymérase. Fin de la note du traducteur.]
Les données du Earth Microbiome Project (EMP) sont constituées d’ensembles de données de référence ouverts ou fermés.
Le didacticiel QIIME (Quantitative Insights Into Microbial Ecology) (qiime.org) définit la référence fermée comme un schéma de classification où toute lecture d’ARNr qui n’atteint pas une séquence dans une collection de référence est exclue de l’analyse.
[Note du traducteur. l’ARNr, c’est, de manière très vulgarisé, l’ARN des ribosomes. Et les ribosomes sont un type d’organite qu’on trouve dans les cellules eucaryotes et procaryotes. Fin de la note du traducteur.]
En revanche, la référence ouverte fait référence à un schéma dans lequel les lectures qui n’atteignent pas une collection de référence sont ensuite regroupées de novo et représentent des unités taxonomiques uniques mais non classifiées.
Nos principaux résultats sont basés sur des données de référence fermées en raison de la plus grande précision de cette approche et du fait que 13\% de tous les taxons de l’ensemble de données ouvert du Earth Microbiome Project (EMP) n’ont été détectés qu’une seule fois, alors que 29\% n’ont été détectés que deux fois.
Nous avons également utilisé 4 303 sites du Data Analysis and Coordination Center for the NIH Common Fund-supported HMP (46).
Ces données consistaient en des échantillons prélevés à 15 ou 18 endroits (y compris la peau, l’intestin, le vagin et la cavité buccale) sur chacun des 300 individus en bonne santé.
La région V3 – V5 du gène de l’ARNr 16S a été séquencée pour chaque échantillon.
Nous avons exclu les sites des phases pilotes du HMP ainsi que les données de séries chronologiques.
Vous trouverez plus de détails sur le séquençage HMP et les protocoles d’échantillonnage sur hmpdacc.org.
Nous avons inclus 1319 projets non expérimentaux de séquençage d’amplicon d’ARNr ciblés par PCR du serveur de métagénomique du Laboratoire National d’Argonne MG-RAST (47).
Cette compilation était composée d’échantillons de systèmes aquatiques arctiques (130 sites; MG-RAST ID: mgp138), d’évents hydrothermaux (123 sites; MG-RAST ID: mgp327) (48), de lacs d’eau douce en Chine (187 sites; MG-RAST ID: mgp2758) (49), sols arctiques (44 sites; MG-RAST ID: mgp69) (50), sols tempérés (84 sites; MG-RAST ID: mgp68) (51), d’échantillons fécaux de bovins (16 sites; MG -RAST ID: mgp14132), d’échantillons de microbiome intestinal humain ne faisant pas partie du HMP (529 sites; MG-RAST ID: mgp401) (52), un ensemble de données à l’échelle mondiale des systèmes fongiques intérieurs (128 sites) (53), et des sédiments d’eau douce, marins et fluviaux intertidaux (34 sites; MG-RAST ID: mgp1829).
L’utilisation de MG-RAST (serveur de métagénomique du Laboratoire National d’Argonne) nous a permis de choisir des valeurs de paramètres communs pour la similarité de séquence (c’est-à-dire 97\% pour le niveau de l’espèce) et l’attribution des taxons, y compris une valeur e maximale (probabilité d’observer une correspondance égale ou meilleure dans une base de données d’une taille donnée) de 10 puissance -5, une longueur d’alignement minimum de 50 pb, et des similitudes de séquence en pourcentage minimum de 95\%, 97\% et 99\% avec la séquence de référence la plus proche dans la base de données ARNr M5 du MG-RAST (47-54).
Ci-dessous, nous analysons les ensembles de données MG-RAST par rapport à ces seuils et ne révélons aucun effet significatif sur les relations d’échelle.
Enfin, nous avons inclus 139 échantillons «enrichis en procaryotes» provenant de 68 sites pélagiques et mésopélagiques, représentant toutes les régions océaniques majeures (sauf l’Arctique) recueillies par l’expédition Tara Oceans (55).
Parmi les taxons non inclus dans nos analyses figurent les reptiles, les amphibiens, les poissons, les grands mammifères, les invertébrés et les protistes.
Ces taxons étaient absents, parce que de grands ensembles de données n’existaient pas pour leurs communautés ou parce que les droits de redistribution ne pouvaient pas être acquis pour la publication.
[Note du traducteur, j’arrête ici parce que j’en ai ras le bol. Et parce que ce sont des détails tellement techniques, que j’ai peur de dire des bêtises au travers de ma traduction. Et parce que, je pense, que, de toute façon, les personnes intéressées par ces détails techniques, préféreront aller lire la publication d’origine en anglais].

C’est quoi un « singleton »? Définition, étymologie, et explication du mot, wiki, cnrtl dictionnaire:
https://youtu.be/Tj1f7zn97Ac

Dans un autre article, publié la même année:
Estimations révisées du nombre de cellules humaines et bactériennes dans le corps. PLOS Biology 2016
https://youtu.be/yyzWRNXsUKo
« 3,8 fois 10 puissance 13 bactéries dans le côlon avec une incertitude d’erreur standard de 25% et une variation de 52% d’écart-type sur une population de mâles de 70 kg. »

F A C E B O O K
https://www.facebook.com/Science-Dr-Dufour-Olivier-2316438282013527/

T W I T T E R
https://twitter.com/dufour_dr

Je suis le Docteur Olivier Dufour. (Montpellier)


0 commentaire

Laisser un commentaire