新闻中心
News Center
Nature Biotechnology | 在相对和绝对微生物组测量中量化样品收集引入的偏差
发布时间:2023-08-24

图片

英文题目:Quantifying bias introduced by sample collection in relative and absolute microbiome measurements

中文题目:在相对和绝对微生物组测量中量化样品收集引入的偏差

发表期刊:Nature Biotechnology

影响因子:46.9

发表时间:2023-4

作者单位:美国斯坦福大学、美国Illumina公司


文章摘要

为了深入了解微生物测量的准确性,评估与样品条件、保存方法和生物信息学分析相关的偏差来源非常重要。越来越多的证据表明,测量肠道中微生物的总数和浓度,或“绝对丰度”,提供了比相对丰度更丰富的信息来源,并可以纠正从相对丰度数据中得出的一些结论。然而,很少有人知道保存方式的选择会如何影响这些测量结果。在这项研究中,研究者分析了两种常见保存液和短期储存条件如何影响微生物相对和绝对丰度的。OMNIgene GUT OMR-200在不同储存温度之间产生较低的宏基因组分类变异,而Zymo DNA/RNA Shield得到较低的宏转录分类变异。绝对丰度定量揭示了保存方式导致的Bacteroidetes/Firmicutes比率不同的两种原因。基于这些结果,本研究建议将OMNIgene GUT OMR-200保存液试剂盒用于现场研究,将Zymo DNA/RNA Shield保存液试剂盒用于宏转录组学研究,并且强烈建议对微生物要进行绝对定量的测定。

为了促进对人类肠道微生物组的了解,研究必须优先考虑准确、非偏差和全面的微生物测量。在现实生活中,肠道微生物组的研究结果受到测量变量和测量方法的影响。因此,详细了解微生物组测量中的偏差来源,并仔细考虑哪些测量具生物学意义,对于提高我们结果的准确性和可重复性至关重要。

微生物组研究通常依赖于DNA或RNA测序来确定样品中各种生物体、基因或RNA的相对丰度。不同的样品保存液和储存条件、DNA提取方法、测序文库制备方法和生物信息学分析等都会影响样品中微生物以及微生物基因的相对丰度。

 人们已经做了大量的努力来校正实验偏差。包括生信分析方法,使用模拟菌群和校准对照,病例对照研究的标准化和使用主成分的无监督校正等。尽管这些方法可以对病例对照研究的批次效应中代表性分类群进行校正,但计算校正方法仍然不完善,这使得在实际检测中将偏差小化变得至关重要。

虽然大多数微生物组研究侧重于相对丰度的测量,但有新的证据表明,测量肠道中微生物的总数和浓度,或“绝对丰度”,可以提供更丰富的信息来源。除了提供关于微生物对宿主生物学的可能浓度依赖性影响的信息,绝对丰度测量可以纠正从相对定量数据得出的错误结论。例如,有研究表明,在一种土壤环境中看起来相对贫乏的某些微生物类群实际上在绝对数量上更加丰富,因为总体微生物丰度更高。绝对丰度测量也揭示了关键的生物学见解。例如,2017年Nature文章研究显示,健康个体的总负荷与克罗恩病个体的微生物负荷相比有10倍的差异,同时由相对定量获得的多个结果,并没有在绝对定量检测数据中得到印证(该文章解读:Nature:要想真正研究宿主-肠道微生物的相互作用,必须将相对定量变成绝对定量)。近,研究人员使用外源微生物内参进行绝对定量,在早产儿队列肠道微生物群落 组装过程中识别出了细菌和真菌之间的相互作用(该文章解读:Nature文章发现微生物群落动态研究绝对定量是关键,内标法比qPCR法定量更好(特异性、灵敏度和一致性更高)。显微镜、16S rRNA荧光原位杂交(FISH)、spike-ins和16S rRNA qPCR等方法可以对肠道中的原核微生物进行绝对定量。然而,目前没有一种绝对定量的方法在研究中被普遍使用。这是不幸的,因为微生物的绝对定量会防止由于只根据相对定量结果得出微生物和宿主生物学之间错误的人为相关性,并且会极大地影响微生物组的各种成分彼此之间以及对人类宿主影响的结论。

与绝对定量的结合依赖于精确和可靠的测量。然而,对于保存液的选择和储存条件对样品以及由此产生的微生物绝对丰度测量值的影响却知之甚少。这一点尤其重要,因为研究人员越来越多地研究偏远环境中的肠道微生物群,在这些环境中,用于样品保存的冷链难以维持,因此使用保存液是必要的。因此,了解保存液选择和运输温度对这些样品的微生物组成的“真实”影响至关重要。大多数量化实验偏差的研究,只研究了DNA提取、文库制备、测序和生物信息分析选择如何影响结果,而忽略了保存液选择和储存条件的影响。少量的研究报道了样品保存液和储存温度条件的选择如何影响结果。这些研究的结果侧重于相对微生物丰度,信息丰富但往往相互矛盾,这使得很难系统地确定保存液和储存对样品微生物组成的影响。

用户友好的收集试剂盒已经获得了普及。随着家庭收集试剂盒,如OMNIgene GUT OMR-200 (DNA Genotek)和DNA/RNA Shield (Zymo Research) 的出现,它们以长期室温储存和易于收集为目标,使样品保存变得更加可靠。尽管取得了这些进展,但关于这些保存液试剂盒的效果仍有不一致的报道。一些研究发现,OMNIgene和Zymo保存液在重现速冻样品的微生物组成方面通常优于其他保存液,代表了粪便样本采集的现行标准。相比之下,其他研究发现这些试剂盒降低了分类多样性或改变了各种分类群的丰度。虽然这些试剂盒,尤其是OMNIgene试剂盒被广泛使用,但是这些保存液在超过室温的温度下还没有得到很好的验证,并且仍然不知道分类群变化是否是由于储存过程中的微生物增殖、特定分类群的选择性裂解或特定分类群的DNA或RNA的选择性消耗。这些试剂盒也没有验证和比较RNA在延长的时间和温度范围内的稳定性。考虑到这些保存液试剂盒的普遍使用,需要通过清晰而有力的研究,以了解保存液的使用如何在测量相对和绝对丰度时影响微生物组分析。

理想情况下,微生物组测量应反映肠道微生物群的组成、丰度和功能的真实状态。使用绝对定量来具体确定哪些分类群的丰度发生了变化,以及检测个体之间整体微生物负载和浓度的高水平差异,将是更准确和信息更丰富的微生物组研究的下一步重要内容。不幸的是,目前还不知道样品收集方法如何影响绝对丰度测量,甚至相对宏基因组和宏转录组测量也没有在某些常见的运输和储存条件下进行大规模稳健评估。尽管现有的相对丰度基准研究已经为可重复的微生物组研究奠定了坚实的基础,但是随着该领域朝着使用绝对定量的方向进行更精确的量化发展,更好的了解实验的选择如何影响结果是势在必行的。为了更好地实现这一目标,本研究系统性分析了几种“真实世界下”的保存条件对粪便样本微生物检测的影响。研究者通过量化OMNIgene和Zymo采样试剂盒对微生物基因组和转录组水平的相对丰度,以及原核生物在基因组水平的绝对丰度的变化,评估了10个不同供体样品的储存条件。本研究结果展示了样本保存偏差如何可能导致混乱的微生物群落测量结果,并对未来研究的实验设计出了具体建议,包括对绝对丰度定量的易于执行的方法。



研究结果


样本收集和研究设计

从来自美国加利福尼亚州的10名成年捐献者获得了粪便样本。为了评估储存温度和保存液选择对粪便微生物负荷和微生物组成测定的影响,研究者将粪便分成有或没有保存液缓冲液 (OMNIgene GUT OMR-200收集管(DNA Genotek)或DNA/RNA Shield粪便收集缓冲液(Zymo Research))的样本。不含保存液缓冲液的样品立即在-80°C下冷冻;含有保存液的样品部分在-80°C下直接冷冻,部分在23°C或40°C下保存7天,然后储存到-80°C。这7个实验条件中的每一个都进行了三次重复,每个捐献者总共分成21份样本(图1)。

图片

图1、研究工作流程概述。从10名捐献者处收集单个粪便样本。每个样品储存在无保存液、DNA Genotek OMNIgene GUT OMR-200保存液或Zymo DNA/RNA Shield保存液中。不含保存液的样品立即储存在-80°C下。含保存液的样品立即储存在-80°C下,或储存前在23°C或40°C下储存1周后再储存到-80°C,每个条件重复三次。然后提取样品的DNA和RNA,并用16S rRNA基因的qPCR、短读序鸟枪法宏基因组测序和短读序鸟枪法宏转录组测序进行测量。


DNA提取和测序

从210个样本中提取DNA,然后进行测序文库制备和2 x 150 bp测序,每个供体样本产生4060万个读序,排除了未通过文库制备的在40°C保存液中的3的样本。质量控制质控后每个样本的宏基因组读序中位数为2740万。还从样品中提取了RNA。虽然大多数样本产生可测量的RNA,但结果发现,储存在40°C OMNIgene保存液中的样本并不能可靠地产生可测量的RNA。所有样品中的rRNA都被去除。对所有产生RNA的样本进行了RNA测序,每个供体样本产生了中位数为6210万的读序。


储存影响宏基因组分类学的测量

本研究首先评估了储存温度和保存液选择对样本相对丰度的宏基因组影响(图2)。正如预期的那样,研究者发现10个捐赠者的相对菌群组成有相当大的差异,还发现了使用保存液带来的系统性差异(图2a)。此外,结果还发现,在23°C和40°C下储存时,使用Zymo保存液储存的样品会引入额外的系统性偏差。这些结果在许多不同的宏基因组测量中是一致的。

为了检验样品保存和储存如何影响分类学相对丰度的,研究者评估了人类粪便中三个丰富的细菌门(拟杆菌门、厚壁菌门和放线菌门)以及病毒和真菌的相对丰度(图2b)。与在无保存液立即冷冻的样品相比,在OMNIgene或Zymo保存液中保存的样品显示出拟杆菌门的相对丰度显著富集和厚壁菌门和放线菌门的相对丰度显著减少。此外,尽管保存在OMNIgene中的样品对更高的储存温度具有鲁棒性,但研究者发现保存在Zymo保存液中的样品显示出随着储存温度的升高,拟杆菌门进一步富集,而厚壁菌门和放线菌门进一步减少的情况。研究还测试了在至少一种条件下相对丰度大于0.1%的所有菌属中由保存液和储存温度引入的系统性偏差,发现结果似乎主要是由门水平的影响驱动的:大多数拟杆菌门的属,如拟杆菌属和另枝菌属被富集,而大多数厚壁菌门属,如粪肠杆菌属和瘤胃球菌属被耗尽。当储存在更高的温度下时,拟杆菌门属在Zymo保存液中进一步富集,而厚壁菌门属在两种保存液中对温度表现出不同的反应。

不同保存方法测得的样品群落多样性差异显著。在OMNIgene和Zymo保存液相对于未加保存液样品的属水平香农指数明显较低 (图2c)。与分类群相对丰度一样,研究者发现OMNIgene在不同温度下储存的样品之间没有显著差异,但Zymo储存在23℃和40°C的样本与储存在-80℃的样品相比,观察到invSimpson指数和总丰度趋势相似(图2d)。总的来说,在没有保存液的情况下立即冷冻样品是检测分类群多样性的佳方法,如Shannon指数和整体丰富度。为了确定保存样品与立即冷冻的未保存样品的分类群相似性,研究者使用Bray-Curtis计算了属水平的β多样性。当立即冷冻时,储存在OMNIgene保存液中的样品与无保存液样品的差异不太相似,而储存在Zymo保存液中的样品与无保存液样品更相似(图2e)。然而,储存在Zymo保存液中的样品不能耐受高温度:储存在23°C和40°C的Zymo保存液中的样品与立即冷冻的无保存液样品不太相似。后发现所有储存方法的来自相同样品的技术性重复结果都较好。总之,本研究再次发现两种保存液都会导致群落组成的变化,并且高温储存会导致Zymo保存液中额外的群落变化。

图片

图2、不同储存条件下样品的宏基因组特征。a,跨样本的15个丰富属的宏基因组相对丰度。由于文库制备失败,来自供体3 Zymo 40°C条件的重复2被排除在后续分析之外。b,宏基因组学每个条件下样本中三个丰富细菌门、病毒和真菌的相对丰度。中心点代表由GEE回归模型确定的估计平均值。c,跨样本的属水平的香农指数。d,样本的属水平丰富度。e,每种保存液不同保存条件之间的属水平Bray-Curtis差异。


综上所述,在一系列与分类群丰度相关的测量指标中,研究者发现OMNIgene和Zymo保存液与直接冷冻的无保存液样品具有显著性系统差异。此外,尽管OMNIgene保存液的结果对温度非常稳定,但Zymo保存液在较高温度下储存时显示出额外的系统差异。这些结果表明,OMNIgene保存液相对于不含保存液储存的样品有区别地溶解一些细菌,而Zymo保存液在立即冷冻时更好地捕获未保护样品的成分,但在暴露于较高温度时不能保护样品成分。


存储影响宏转录组分类学的测量

宏转录组分析可以量化肠道微生物群的活跃功能景观,提供对肠道微生物在响应各种内部和外部刺激时的动态基因表达的情况。尽管微生物转录反应可能是疾病状态的更引人注目的生物标志物,但粪便样品中的稳定RNA比稳定DNA更困难,因为RNA的温度敏感性和粪便样品中存在有效的RNA酶。与Zymo试剂盒不同,OMNIgene OMR-200试剂盒不适合RNA保存;然而,它是粪便微生物研究中常用的保存液之一。由于在确定这些样本是否可以扩展到基于DNA的应用之外的用途方面可能存在兴趣,研究者评估了OMNIgene试剂盒为宏转录组研究保存RNA的能力。结果发现,可以从保存在OMNIgene保存液立即冷冻或暴露于23℃ 1周的样品中提取RNA,这表明该试剂盒可能用于宏转录组分析。相比之下,我们无法从储存在OMNIgene保存液并暴露于40℃ 1周的样品中提取RNA,因此,我们将这些样品排除在以下分析之外。

我们检测了所有10个捐赠者和6个条件下样本的宏转录组(图3)。结果观察到在不同保存条件和温度下宏转录组分类群组成的高度可变性(图3a),这强调了鉴定用于RNA保存的适当稳定剂的重要性。类似于在宏基因组数据中观察到的,研究者发现使用OMNIgene或Zymo保存液对测量的宏转录组有显著影响。例如,当评估人类粪便中丰富的细菌门、病毒和真菌宏转录组的相对丰度时,结果发现,与立即冷冻的无保存液样品相比,立即冷冻的任一保存液样品中拟杆菌门转录本的丰度明显较高,而厚壁菌门和病毒转录本的丰度较低(图3b)。

与宏基因组的结果相反,对于宏转录组来说结果发现这两种保存液对温度效应都不敏感。研究者在转录本组成的许多不同比较中观察到这些趋势。当评估转录本的相对丰度时,结果发现拟杆菌门、厚壁菌门和放线菌门在至少一种储存条件下都有显著的相对富集或减少(图3b)。在测试相对丰度大于0.1%的所有属在属水平的宏转录组相对丰度差异时观察到,属水平的差异是由门水平的观察结果驱动的。

分类群落多样性的指标显示了不同保存方法之间更微妙的差异。在立即冷冻的Zymo保存液的样品中与暴露于40°C的样品相比香农指数更高(图3c),尽管当考虑属水平的丰富度时没有观察到这种差异(图3d)。这些α多样性指标表明,保存在保存液中的样品与立即冷冻的无保存液样品保持相似的α多样性,但保存液对温度变化的防护能力各不相同。对β多样性的比较还表明,两种保存液对温度的影响都不稳定:当暴露在较高温度下时,储存在OMNIgene或Zymo保存液中的样品与立即冷冻的无保存液样品相比显著不同(图3e)。此外,研究者还测量了同一样品的技术重复之间的差异,发现所有储存方法都具有相似的技术性重复。

图片

图3、不同储存条件下样品的宏转录组特征。a,跨样本的15个丰富属的宏转录组相对丰度。b,每个条件下样本中三个丰富的细菌门、病毒和真菌的宏转录组相对丰度。c,跨样本的属水平的香农指数。d,样本的属水平丰富度。e,每种保存液不同保存条件之间的属水平Bray-Curtis差异。


综上所述,本研究观察到OMNIgene或Zymo保存液相对于没有保存液立即冷冻的样品的宏转录组组成的显著差异。实验还观察到,这两种试剂盒可能仍然会有样品的降解,导致暴露于高温后宏转录组分类群组成的显著变化。



肠道原核生物的绝对丰度

接下来,研究者探究了在保存和温度条件下观察到的分类群差异是否是由微生物裂解、核酸降解或微生物生长的差异引起的。虽然相对丰度数据可以识别不同条件下的不同丰度分类单元,但这些数据不能确定差异是由于一个分类单元的测量丰度增加,还是由于其他分类单元的测量丰度减少,还是两者的某种结合造成的。因此测量了细菌和古菌的总体丰度,以确定每个样本的总微生物量和每个分类单元的微生物量。研究者使用针对细菌/古细菌16S rRNA基因的qPCR来测量不同保存液和温度条件下每个样品中16S rRNA的总拷贝数(图4)。如同16S rRNA扩增子测序一样,用于绝对定量的引物应该对古细菌和细菌中的所有16S rRNA序列是“通用的”。我们基于由质粒制成的标准物计算了16S rRNA的总拷贝数,所述质粒含有10个供体中丰富的厚壁菌和类杆菌物种的普拉梭菌或普通拟杆菌的16S rRNA基因,并且发现qPCR引物在这两个靶序列中表现相似。为了解释保存液缓冲液的样品稀释情况,我们通过粪便的干重来校正OMNIgene或Zymo保存液样品的16S rRNA拷贝数。然后通过调整每个样本的宏基因组数据中存在的分类群的预期16S rRNA拷贝数来确定总原核生物载量。本研究还根据每个分类单元的宏基因组相对丰度计算了每个分类单元的载量。在没有保存液的情况下立即冷冻的样本平均每克干粪便含有1.33 × 1012个原核生物 (图5a)。根据之前报道的结肠总容积约400 ml来进行校正,推导出人类肠道中约100万亿(1.2 × 1014)个原核生物,比之前广泛引用的估计值高出约3.2倍。对总微生物负荷的这一估计意味着原核生物与人类细胞的总比例约为4:1。值得注意的是,本研究的比率估计值仅限于10名供体,并且没有更新之前对结肠总体积和人类细胞计数的估计,这可能因人而异,可能需要在未来的研究中进行修订。

图片

图4、绝对丰度量化工作流程。要计算给定粪便样本中的细菌总数,需要构建一条标准曲线。定制合成的ampR质粒,包含普拉梭菌或普通拟杆菌的16S rRNA序列经过1:10-1:10 M的稀释系列。对标准品进行16S rRNA qPCR分析,并计算拷贝数以生成每个质粒的标准曲线。稀释研究样品,与mastermix混合并通过qPCR与标准品一起测量,三个重复。此外,粪便重量通过在100°C 24小时干燥前和干燥后称重获得。每个样品的16S rRNA拷贝数由标准曲线确定,并针对稀释进行校正。16S rRNA拷贝数还根据粪便的湿重进行修正。由于微生物可能携带多个16S rRNA拷贝,因此对每个分类单元进行拷贝数校正,以得出每克干粪便的细菌总数。


有趣的是,本研究发现总微生物负载的这些测量对样品如何保存和储存敏感,具有小的技术变化。储存在OMNIgene保存液中的样品相对于储存在无保存液中的样品具有200%以上的微生物载量。与之相比,储存在Zymo保存液中的样品相对于立即冷冻的无保存液样品检测到更低的微生物载量。此外,虽然样本在OMNIgene保存液在储存于23°C或40°C时具有相似的细菌量,储存于Zymo保存液中的样品在储存于更高温度时产生逐渐降低的细菌量。研究者假设储存在OMNIgene保存液中样品的较高微生物载量是由于增加的裂解和提取效率,而储存在Zymo保存液中样品的较低微生物载量反映了冷冻前的核酸降解。研究者不认为这些结果是由于微生物的生长,因为没有观察到保存在保存液中的细菌培养物的生长(图5b)。方差分析表明,保存液和温度解释了微生物丰度变化的37.6%,而供体仅解释了25.9%,表明样品处理方法对绝对定量的影响大于个体间变化。总之,这些结果表明OMNIgene保存液可以比单独的标准提取方法更有效地裂解肠道细菌,并且当储存在Zymo保存液中时,DNA在更高的温度下可能不稳定。

使用绝对计数和宏基因组分类丰度的总估计值,研究者探讨了保存液和温度是否会对数据集中三个丰富的门的绝对计数产生不同的影响。这似乎是合理的,因为先前的工作已经证明不同的微生物分类群对裂解方法有不同的敏感性。结果发现,储存在OMNIgene保存液中的样品相较于立即冷冻的、没有保存剂的样品中放线菌门数量没有显著变化,但具有更高的拟杆菌门和厚壁菌门的总量,储存在Zymo保存液中的样品相对则具有更高的厚壁菌门和拟杆菌门的含量,而具有更低的放线菌总量(图5c)。随着温度的升高,保存在OMNIgene中的样品显示出与保存在保存液中的立即冷冻样品相似的三个门的富集程度,证明了OMNIgene保存液的温度稳定性。相反,储存在发酵保存液中的样品在较高温度下耗尽了所有三个门,相对于拟杆菌门,厚壁菌门的损耗更大。

基于观察到的厚壁菌门和拟杆菌门绝对载量随保存液和温度的变化,研究者分析了通常报道的拟杆菌门和厚壁菌门的比例(图5d)。结果发现储存在OMNIgene保存液中的样品相对于未加保存液样品具有显著更高的拟杆菌门:厚壁菌门比率。类似地,保存在Zymo保存液中的样品也比未保存的样品具有更高的拟杆菌门:厚壁菌门比率。此外,拟杆菌门:厚壁菌门的比例明显高于冷冻前储存在23℃或40℃的Zymo保存液样品。

总之,本研究观察到保存液的选择对测量微生物载量有很大的影响,强调了样品处理选择对绝对测量的影响。此外,研究者发现绝对定量的使用可以识别究竟是哪些分类群对相对定量的比率结果产生了影响,证明了绝对丰度定量在揭示关键信息方面的重要性,而这些信息在相对丰度数据结果中是模糊不清的。目前,在大多数肠道微生物组研究中没有进行微生物丰度的绝对定量。然而,这些数据说明了绝对定量在检测个体间微生物总载量的差异和鉴定特定分类群的生长或消耗中具有非常重要的作用。

图片

图5、微生物组样品的绝对丰度量化。a,用细菌/古细菌16S rRNA基因的qPCR计算的每个样品每克干粪便的微生物总数。b,多形拟杆菌、大肠杆菌和粪肠球菌在生长培养基、OMNIgene或Zymo保存液储存后的总菌落形成单位(CFU)。接种后或在37°C下培养72小时后,立即对培养物进行铺板。在接种到OMNIgene或Zymo保存液后,未观察到任何分类群的CFUs。c,每个样品单位粪便克数中拟杆菌门和厚壁菌门在OMNIgene保存的样品(上图)和Zymo保存的样品(下图)中的总数。d,拟杆菌门与厚壁菌门数量的比率。


通过这项研究,研究者发现样品收集方法对微生物群落测量有很大影响。本研究证明了保存液的使用可以显著影响微生物的总载量,并改变门水平和属水平的分类群丰度。即使在小量个体中,研究者也发现原核生物的绝对丰度会因捐赠者而异。考虑到细菌载量和相关特征的重要性,如宿主生物学上的膜脂多糖剂量,以及微生物群落组装的重要性,本研究推测微生物总载量可能是疾病进展和治疗结果的重要生物标志物。作者预计未来的研究将通过测量绝对丰度,以更好地关联微生物组和人类健康结果。研究者预计这些结果和相关研究将成为指导大队列研究设计的佳实践,为荟萃分析中的跨队列比较提供信息,并使研究人员能够针对其特定的研究问题优化样本收集方法。





copyright © 2008-2023 昊为泰 reserved. ICP备案序号:沪ICP备18028200号-1沪公网安备 31011502016782号