新闻中心
News Center
Microbiome文章指出微生物组的绝对定量比相对定量结果,可以更好的避免因遗传力估计不准确而产生的误导
发布时间:2024-03-06

前人大量研究已经充分表明,准确定量微生物的绝对丰度而不是相对丰度,对于确定微生物真实差异、跟踪微生物群落组成的动态变化,寻找关键的核心物种和相互作用,以及排除错误关联等,都具有极其重要的作用(文章链接:多篇Nature强烈建议:微生物真实差异、疾病标记物、核心菌群筛选、模型预测、动态变化、菌群互作网络、群落组装要用“绝对定量”)。目前常规的扩增子测序只能提供相对定量结果,而利用内标法的绝对定量测序技术不仅可以分析样品中微生物总的绝对拷贝数,还可以分析样品中每类微生物的绝对拷贝数,进而更好地反映微生物群落的绝对丰度和动态变化,为微生态相关研究提供更可靠、更全面的数据信息。


近期,来自荷兰阿姆斯特丹大学、美国普林斯顿大学、纽约大学和加州大学伯克利分校的科研人员,联合在微生物研究一区Top期刊《Microbiome》(IF=15.5)上发表研究论文。该研究明确指出,使用相对丰度而不是绝对丰度结果来估计微生物组遗传力时,可能出现三大问题(1)微生物之间的相互依赖性导致遗传力估计不准确,特别是对于高丰度优势类群为明显。(2)大样本量造成假阳性率偏高,从而导致对可遗传微生物比例的高估。(3)微生物共丰度导致遗传性估计出现偏差。

1.png

英文题目:Relative abundance data can misrepresent heritability of the microbiome

中文题目:微生物组的相对丰度数据可能误导遗传力估计

发表期刊:Microbiome

影响因子:15.5(一区Top)

发表时间:2023年10月


背景

微生物组对宿主表型的影响日益显著,涵盖了从新陈代谢到行为等各个方面,包括对一系列疾病风险因素的影响。然而,研究者对宿主遗传在塑造微生物组成方面的贡献却刚刚开始,越来越多的研究探索这些关联及其机制(直接或间接地,例如通过与饮食相关的遗传关联)。这种兴趣不仅源于研究者希望了解进化和共同进化如何在短期和长期时间尺度上塑造了宿主-微生物组相互作用,而且确定宿主-微生物组关联的遗传基础对健康方面的应用有重要影响。解决这些问题的关键在于研究者能否正确地测量遗传和环境因素对微生物组组成的重要性

2.png

遗传力(h2)是定量遗传学的一个核心参数,它量化了父母和后代之间相似性遗传基础的一个关键方面。表型性状的遗传性是一种统计特性,定义为群体中可归因于遗传变异的表型差异比例。在估计微生物组遗传力时,主要表型性状通常是群落组成或给定分类单元丰度的指标。虽然人们普遍认为大多数微生物组成员的遗传力相对较低,但对宿主遗传变异在塑造微生物组组成方面的重要性的具体估计在不同研究中差异很大(表1)。

表1、微生物类群丰度遗传力估计研究统计表

3.png


遗传力作为遗传学相关指标无处不在,但如何正确的测量及解释它,仍然存在许多的问题。根据定义,遗传力是一种针对特定种群的估计,并受环境和种群遗传结构的影响。此外,检测到非零微生物组遗传性并不能告诉我们任何关于导致相关个体平均具有更相似微生物组的机制。有几种可能的机制,微生物可能从父母(通常是母亲)垂直传播给后代,例如通过阴道分娩期间的转移或通过母乳传播;或从其他家庭成员水平传播,可能仅仅是因为他们距离较近。这两种效应都可能导致宿主和微生物基因型之间的紧密联系,从而增加遗传力。或者宿主基因型可能直接影响可以建立的微生物类型。相反,如果估计遗传力为零,这并不一定意味着没有垂直传播(或来自亲戚的水平传播),它可能只是意味着环境的影响要大得多,并且掩盖了这些传播效应。

在估计微生物组遗传力时,方法学上的复杂性是微生物的绝对丰度通常是未知的。因此,通常的做法是通过将每个样品的总和设置为1来计算相对丰度,从而得到所谓的“组成数据”相对定量获得的“组成数据”的固有问题早已得到认可,并且已知它们会导致变量之间的虚假相关性,即使根本不存在相关性。近,已有大量研究在微生物数据的背景下对此问题进行了讨论,例如,在检测不同治疗组的差异丰度微生物(例如宿主患病状态)等研究。微生物组遗传力的估计源于宿主基因型之间不同丰度的比较,因此可能存在类似的问题。然而迄今为止,关于微生物遗传力估计的研究,尚未明确考虑与使用组成数据相关的潜在问题。

本研究提出了使用相对丰度时获得的微生物分类群特异性遗传力的近似值(称之为φ2值)。本研究表明该指标与传统的遗传力h2估计不同:不仅仅是宿主遗传和表型差异的函数,还取决于主要微生物和群落其余部分的各种其他特性。基于此,本研究确定了使用相对丰度数据估计分类单元遗传力时可能出现的三个主要问题。首先,由于相对丰度本质上是可比的,某些微生物的可遗传信号可能导致非遗传微生物的虚假遗传力估计,反之亦然,非遗传微生物可以掩盖可遗传微生物的遗传信号。这个问题在优势类群中为明显,而这个问题对低丰度类群的影响减弱了,其中两个遗传力估计值(h2和φ2) 收敛。第二,虽然非遗传微生物的估计遗传力可以接近于零,但它可能永远不会完全达到零。当对大量宿主进行采样时,即使是这种非常微弱(虚假)的可遗传信号也可能非常显著,从而反映出更大的统计功效。当考虑群落中的许多微生物分类群时,会明显高估可遗传微生物的总体比例。第三,共丰度变化的微生物分类群(例如由共享生态位或微生物相互作用引起),可能导致h2和φ2之间的巨大差异,系统地产生遗传力估计偏差。根据协方差的性质和符号,这可能会掩盖或夸大真正的遗传力信号。在推导出近似值之后,本研究详细介绍了这些问题。本文得出的结论是,在解释基于相对丰度的遗传力估计值和比较不同研究的值时必须谨慎,并且微生物绝对丰度的近似值可能有助于解决这个问题


分类单元丰度遗传力和基于相对丰度的遗传力近似值

在估计分类单元的遗传力时,人们依赖于定量遗传模型,将分类单元的丰度视为宿主的定量表型性状。当绝对丰度已知时,可以通过量化宿主遗传变异的总方差比例来简单地估计分类单元的遗传力。然而,我们通常只能获得宿主个体中的相对丰度变化结果。而相对丰度的分布不仅取决于焦点微生物,还取决于由类群组成的整个群落的绝对丰度。


根据遗传力的定义,分类单元i的遗传力为:

4.png


其中:VPi是分类单元i的绝对丰度方差,VGi是宿主i遗传贡献方差。


使用相对丰度数据而不是绝对丰度数据时,获得的分类单元 i 的遗传力的近似值为:

5.png

其中:遗传力φ2是焦点分类单元属性的函数,具有描述绝对丰度的遗传和表型变异的参数VG和VP,以及α描述平均绝对丰度。φ2也是焦点分类单元 i 与群落中其他每个分类单元之间的遗传和环境协方差总和的函数(γ和ϵ)。后φ2是背景群落(不包括焦点分类群)各种属性的函数:A是背景群落的平均绝对丰度,ω和z是背景群落绝对丰度的总宿主遗传和表型方差(即所有分类群的方差总和),以及κ和ν是每对背景群落成员之间的遗传和环境协方差之和。


问题1:分类群之间的相互依赖性导致遗传力估计不准确

由于相对丰度不是独立的,某些微生物的可遗传变异会导致其他微生物的虚假非零遗传力。反之亦然,非遗传微生物可以掩盖可遗传微生物中的遗传信号。考虑只有两种同样丰富的微生物的极端情况,其中微生物 A (蓝色)的遗传力为 1,微生物 B (红色)的遗传力为 0(图1A)。由于丰度与相对丰度成比例,因此微生物B丰度的变化似乎仍受宿主遗传学的影响(图1 A)。此外,将两种微生物的丰度都表示为相对丰度在一定程度上掩盖了宿主对微生物A的遗传效应。这导致两个物种的遗传力估计值为0.5,这在两种情况下都是错误的,并导致两种微生物都是可遗传的错误结论。

6.png

图1、由于微生物的相对丰度是相互依存的,一种微生物中的可遗传信号可能导致第二种微生物中不可遗传的虚假遗传信号,或掩盖可遗传微生物中的遗传信号。图1A)展示了三种宿主(小鼠)基因型和两种微生物,其中一种微生物是完全可遗传的(蓝色,h2=1),一种微生物不可遗传(红色,h2=0)。因此,蓝色微生物的平均绝对丰度因基因型而异,而红色微生物的平均绝对丰度是恒定的。使用绝对丰度可以正确估计遗传力。然而,由于相对丰度不是独立的,可遗传微生物丰度中的宿主遗传信号也会在第二种微生物中产生宿主遗传信号,从而在基因型之间产生相对丰度的差异。这会导致这两种微生物不正确的遗传力估计。B )当基于相对丰度时,焦点微生物和整个群落的特性都会影响遗传力估计。通过改变焦点微生物的平均绝对丰度(α)与背景群落绝对丰度(A)相比(x轴为α/(α+ A))。黑线为焦点微生物的遗传力0.5;背景群落不可遗传。灰线为焦点微生物不可遗传,但背景群落平均遗传力为0.5。C) 基于绝对丰度或相对丰度(y 轴)变化时遗传力估计值的差异α与A(x轴)比较。当焦点微生物的平均绝对丰度低于背景群落的总平均丰度时,h2和j2差异变小。焦点分类单元 i 的h2为0.2,彩色线表示背景群落的不同遗传力。


问题 2:样本量大导致错误发现率高

由于相对丰度的相互依存性,当丰度测量是相对的时,不可遗传的微生物仍然可以显示遗传信号。本研究使用 R-package simr进行了功效分析,该分析基于对数似然比检验,比较了有和没有遗传力的模型。结果取决于焦点微生物和背景群落的特性,但一般来说,较大的样本量会增加非遗传微生物被认为是可遗传的几率。当有足够大的数据集时,统计功效达到 100%(图2)

7.png

图2、基于模拟的功效分析,随着样本量的增加,非遗传微生物的遗传力(VG=0) 错误地显示显著增加(α < 0.05)。结果既取决于焦点微生物,也取决于背景群落的特性。不同颜色显示焦点微生物(α)的不同丰度,同时保持背景群落丰度不变。线型表示背景群落的遗传力。


因此,群落中可遗传微生物的数量可能会被严重高估,尤其是在样本量大的情况下。需要注意的是,高错误发现率不是抽样错误或混杂因素等问题,仅增加数据收集工作或质量并不能解决这些问题。同样,更高级的建模方法,如交叉验证、排列分析和多次测试校正,也不太可能完全解决这个问题。这是因为该问题是使用相对丰度所固有的,即在非遗传微生物的相对丰度中确实存在宿主遗传信号


问题3:微生物共丰度导致遗传力估计有偏差

非零协方差反映了微生物分类群的共丰度。在本研究的框架中,有两个过程会导致微生物相对丰度增加:宿主遗传相关性和环境相关性。第一种在宿主基因型水平上产生微生物共丰度:例如,平均而言,微生物丰度较高的宿主基因型也具有较高的微生物丰度B。第二种方法通过创建相关的环境(残差)项,在单个宿主水平上产生共丰度。值得注意的是,正如定量遗传学的一般做法,本文中使用术语“环境”来涵盖遗传学之外的所有内容:它本质上是一个残余术语。就微生物组而言,它捕捉了生态环境因素对微生物丰度的影响,例如温度或土壤,其中微生物之间共享的生态位可能导致环境相关性。残差项还捕获了宿主内部环境和宿主塑造的影响,宿主内其他微生物的丰度,或者只是无法解释的噪音。在宿主内部起作用的一种生物过程会导致环境相关,即微生物相互作用。强烈的互惠互利性相互作用,导致积极的环境相关性。另一方面,拮抗相互作用导致负环境相关性。

非零协方差可以在不同方向上改变遗传力估计值,具体取决于协方差的性质(即遗传或环境),以及协方差是否涉及焦点分类单元和/或背景群落。对于这里给出的结果,研究者假设每个微生物对(包括焦点和背景群落成员)具有相同的遗传和环境相关性。

在具有正遗传协方差的群落中,遗传力通常向下偏倚(图3c)。这是因为正遗传协方差对分子的影响比对分母的影响大。为了直观起见,这里考虑两种同样丰度的微生物的遗传力均为 0.5,并且还具有很强的遗传相关性(rG= 0.99)。如此强的遗传相关性意味着两种微生物的宿主遗传效应是相似的,因此两种微生物在宿主基因型水平上显示出共同丰度。因此,两种微生物的绝对丰度因宿主基因型而异,但它们以完全相同的方式变化(图3a)。在计算相对丰度时,不同基因型的丰度变化完全消失,这导致了错误的结论,即没有微生物显示出可遗传的信号。

8.png

图3、当微生物之间存在宿主遗传和/或环境相关性时,使用相对丰度会导致遗传力估计有偏差。A 说明了遗传相关性的影响。例如,这里展示了三种宿主基因型和两种微生物,它们都是部分可遗传的(h2= 0.5),并且具有很强的遗传相关性(rG= 0.99)。这意味着两种微生物的宿主遗传具有很强的相关性。因此,两种微生物的平均绝对丰度在宿主基因型中以相同的方式变化。当使用这些绝对丰度时,可以准确估计遗传力。然而,在计算相对丰度时,宿主基因型之间的任何变化都会消失。这会导致不正确的遗传力估计,完全掩盖了宿主的遗传信号。B 说明环境相关性的影响。在这里展示了三种宿主基因型和两种微生物,它们显示出很强的环境相关性(rE= 0.99)。因此,这减少了基因型内的变化量。使用绝对丰度时,可以准确估计遗传力。然而,由于每种基因型内相对丰度的差异大大减少,因此得到了错误的遗传力估计。C-E 基于绝对丰度和相对丰度的遗传力估计值的比较,改变环境相关性 (C)、遗传相关性 (D) 或两者兼而有之 (E)。当通过在模拟的相对丰度数据上拟合混合效应模型来估计遗传力时,叉号显示了相关结果。


群落中的正环境协方差在很大程度上具有相反的影响,即影响分母而不是分子。微生物之间的正宿主遗传相关性往往会减少基因型之间相对丰度的变化,而正环境相关性往往会减少基因型内的变异量(图3b)。因此,正环境协方差导致遗传力普遍向上偏倚(图3c)。

后,当一个群落中同时存在正向遗传和环境相关性时,两种遗传力测量之间的关系可能变得高度非线性,因此基本上不可能基于φ2预测h2(图3e)。


制定当前经验估计范围

本研究结果为考虑迄今为止发表的遗传力估计范围提供了额外的信息。研究者对已发表文献的分析表明,由于大多数分类群可能具有较低的相对丰度,因此大多数单个分类群的遗传力估计可能非常准确。然而,不同研究纳入的分类群数量存在很大差异,此外,人类微生物组通常以少数优势分类群为特征。本研究结果表明,对于仅包括少数分类群的研究(例如,在低多样性群落或大多数分类群很少见并因此在过滤步骤中被排除在外的群落中),或者微生物组群落以少数高度优势分类群为特征的研究,精确的遗传力估计将具有挑战性。

研究者还发现了第二个与采样宿主数量有关的问题:由于错误发现率高,可遗传微生物的比例可能被大大高估。对可遗传微生物比例的经验估计显示,与采样的宿主数量呈正相关(图4)。当然,较大的样本量总是会带来更显著的结果,因为样本量越大,检测小效应的能力就越强。这里的挑战在于,如果不更多地了解潜在的群落,我们就无法确定这种数据中中有多少是“真实的”,有多少是由于错误的发现。每种微生物终都可能具有明显的遗传性,并具有足够的统计功效。

9.png

图4、(A)可遗传分类群比例的经验估计和(B)平均分类单元遗传力,包括所有显著可遗传微生物,与样本量(即采样的宿主数量)的关系。圆点表示表1中给出的值,其中每个圆点中的数字对应于表1 中的“数字”列。蓝绿色线表示基于 A 二项式回归和B线性回归而进行的预测。在 B 中,虚线将平均遗传力与每项研究中发现的低和高显著遗传力连接起来。


本文分析纳入的前人研究在样本量以外的许多方面也都存在明显差异,包括生物学(例如宿主系统、种群和组织、分类水平、任何其他协变量)和方法学(例如数据收集、显著性测量、统计模型)。没有理由期望可遗传微生物的真实比例或平均遗传力在研究中是相同的。

后,本研究结果表明,φ2相对于h2的偏差取决于h2的大小以及遗传和环境相关性的潜在模式(图3)。由于对微生物之间相关性(绝对丰度)的性质和强度知之甚少,因此很难解释这种偏差对迄今为止已发表结果的影响。然而,这些结果确实强调了进一步努力估计共丰度模式的重要性。

尽管通常使用微生物相对丰度数据作为绝对丰度的代理来估计微生物遗传力,但很少有研究考虑相对丰度的统计分析可能导致的固有问题。似乎没有一个简单的解决方案来完全解决被文描述的问题,但本文讨论了推进该领域的几种潜在方法。一个可以明确解决相互依赖的相对丰度数据问题的解决方案是量化分类单元(或组)的绝对丰度。在对特定微生物分类群感兴趣的情况下,可以使用定量PCR(qPCR)、微滴数字PCR(ddPCR)或流式细胞术等靶向方法直接定量绝对丰度。此外,对于易于培养的微生物,培养的菌落形成单位(CFU)计数可作为估计绝对丰度的方法。然而,这些方法对于涉及构成数百到数千个分类群的微生物组的研究仍然具有挑战性。一种可能的解决方案是将微生物相对丰度数据与样品总微生物载量的估计值相结合。例如如果给定的分类单元占样品中16S rRNA基因区段的1%,则将该1% 乘以16S rRNA 基因扩增子的总数(例如来自使用相同引物、相同DNA样本量和 PCR循环数的qPCR方法),可以提供该分类群绝对丰度的估计值。为了进一步改进这种方法,研究人员可以靶向已知的单拷贝基因,而不是16S rRNA基因,例如rpoB。虽然本文作者还不知道有任何研究在微生物组遗传力的背景下解决这个问题,但是比较使用绝对丰度和相对丰度的研究已经开始出现。

通过这项研究,作者希望让研究人员意识到与微生物组遗传力估计相关的挑战,并提醒研究人员在解释单个分类群的遗传力估计值,以及解释可遗传微生物的总体比例时要小心。关注研究结果的一致性,以及对技术和统计方法的持续开发,以获得更接近绝对丰度真实值的结果,这些努力将会提高我们研究与宿主密切相关的微生物组成员的能力。


属于微生物组“绝对定量”的时代,已经到来!


01天昊生物Accu16S®细菌与AccuITSTM真菌绝对定量测序专利技术简介:

天昊生物开发的微生物Accu16S®细菌与AccuITSTM真菌绝对定量测序技术,是一种基于添加内标序列的微生物绝对定量检测方法。本技术通过向样品DNA中添加天昊专利的人工合成已知拷贝数内标序列,然后进行16S扩增子文库构建、测序,再根据内标序列reads数及其绝对拷贝数绘制出标准曲线,后可获得样品中OTU代表序列对应的细菌物种绝对拷贝数。利用该方法,研究者可以同时获得绝对定量分析结果、常规扩增子相对定量结果,以及相对定量与绝对定量的比较分析结果,可谓“一次检测,三套结果”,数据更加全面准确

10.png


02传统的微生物扩增子相对定量测序的“技术痛点”:


1、只能获得相对定量结果,可能推导出错误结论;

2、传统qPCR等方法定量费时费力,无法避免跨平台系统误差;

3、针对特殊样本,无法排除PCR抑制剂干扰。

11.png


上图为微生物群“相对丰度(Relative abundance)”和“绝对丰度(Absolute abundance)”随时间变化比较示意图。只检测相对定量数据会掩盖了潜在微生物群落的动态变化,使变化过程中的差异更难被发现。(图片来源:Nature,2021)

12.png

上图为菌群组装过程主要由微生物之间不对称的相互作用,而基于相对丰度的数据推断出的相互作用会产生误导性的错误结果。a,相对丰度数据无法正确推断互作网络中的不对称相互作用,例如相对丰度无法检测到Staphylococcus 对Klebsiella生长的促进,还错误地推断Staphylococcus 对Candida的促进,并且无法检测到Candida或Enterococcus对Klebsiella 的生长抑制。而绝对丰度则准确推断出了上述互作关系,并且利用动物实验得以确认。(图片来源:Nature,2021)

13.png

上图为人类肠道菌群变化与微生物定量方法之间存在差异。本研究发现克罗恩氏病患者(CD)和对照人群(Control)粪便微生物的“相对丰度(RMP)”和“绝对丰度(QMP)”结果,在一些菌属中存在显著性差异。只考虑“相对定量”结果,可能会造成结论的错误或者关键菌属信息的丢失。(图片来源:Nature,2017)

14.png


03天昊扩增子绝对定量测序技术优势:

一次检测,三套数据,结果更丰富;

对样本的需求量要求低,避免因样本无备份等造成的无法检测情况;

检测通量高,检测合格范围内各类菌种均可绝对定量;

相对定量和绝对定量数据相互印证,减少传统相对定量假阳性问题;

避免跨平台qPCR定量的系统误差;

内标法比qPCR在定量上具有更高的特异性、灵敏度和更好的一致性;

避免因样本DNA抽提等原因造成的PCR抑制剂残留对结果准确性的影响;

避免qPCR等定量实验碰到的引物设计和优化难题。

15.png

18.png


取得成绩

截至目前,天昊客户利用微生物绝对定量测序共发表SCI文章52篇,其中JCR分区在Q1区的高分文章多达27篇,研究领域涉及医学、环境、食品、农学和生态等各个领域,样本类型包括人类及动物粪便、土壤、体外发酵液、水体生物膜、酒类发酵物及口拭子DNA样本等。

16.png


天昊客户文章中关于“绝对定量”和“相对定量”异同结果的描述:

17.png

19.png


关于天昊

上海天昊生物科技有限公司,2008年4月创建于上海浦东张江高科技园区,上海市高新技术企业。天昊生物建立了整套完备的实验室管理体系和标准流程,为国内外基因生物领域科研机构、医学院校以及生物制药企业提供精确、高效的基因检测分析服务。

天昊生物具有极强的技术研发实力,研发了多项具有国际水平的专利技术,包括多种SNP分型和拷贝数检测技术、微生物16S扩增子绝对定量技术。同时利用专利自主研发的AccuCopy®、CNVplex®、SNPscan®、iMLDR®、EasyTarget®、FastTarget®、SNPseq®、CNVseq®、MethylTarget®和SSRseq®等全新技术为客户提供灵活定制科研项目检测服务。在2018年荣获“浦东新区企业研发机构”称号,2023年荣获“上海市专精特新中小企业”称号。

天昊生物遗传分析中心借助多名长期从事基因及遗传分析的领域专家构成的专家咨询团队,专业团队结合准确、高效、经济的科研技术服务体系,致力于长期为分子生物学及医学遗传学领域的研究者提供高质量的科研策略咨询、实验技术服务和遗传数据分析,帮助广大科研人员获得更为优质的科研成果。


往期绝对定量相关文章链接:


copyright © 2008-2023 昊为泰 reserved. ICP备案序号:沪ICP备18028200号-1沪公网安备 31011502016782号