咨询热线:400-065-6886   天昊基因

中文 / English

主页 > 技术支持 > 科研进展 >

ATAC-seq揭示非小细胞肺癌开放性染色质图谱


文章标题:The Open Chromatin Landscape of Non-small Cell Lung Carcinoma
发表杂志:Cancer Research
影响因子:8.378
发表时间:2019年6月


    2019年6月来自华西医院的科研团队于Cancer Research杂志发表了题为“The Open Chromatin Landscape of Non-small Cell Lung Carcinoma”的文章,结合50例原发性非小细胞肺癌(NSCLC)患者的开放染色质数据(ATAC-seq)、全基因组测序数据(WGS)和RNA测序数据(RNA-seq)揭示了NSCLC的开放染色质图谱(Figure1A)。其中发现患者间开放染色质的异质性,异质性的程度与一些临床参数相关,而且肺腺癌(LUAD)和肺鳞癌(LUSC)间也显示出明显不同的开放染色质模式。
 

 
 
Figure1A 实验总体设计思路
 
主要研究结果
 
1. 实验总体设计及样本突变特征

    研究人员共收集了34例腺癌患者、13例鳞癌患者及4例非恶性结节患者(BSPN)的原发肿瘤样本,同时收集40例NSCLC及2例BSPN患者对应的癌旁样本供somatic突变calling(Figure1A)。其中绝大多数somatic SNVs和indels位于基因间区和内含子区(Figure1B)。与先前报道相似在NSCLC驱动基因中发现了一些somatic SNVs,包括TP53在26.92%的LUAD患者和33.33%的LUSC患者中,EGFR在19.23%的LUAD中,CSMD3在33.33%的LUSC中,NFE2L2在33.33%的LUSC中(Figure1C)。所有的LUSC样本与富集的突变特征S3(与COSMIC signature 5类同)相关,而大多数LUAD样本与突变特征S2(与COSMIC signature 9类同)相关(Figure1D)。基于四种突变特征的贡献度将所有样本进行聚类,绝大多数样本聚类结果较好(Figure1E)。同时在这些样本中发现很多已知基因存在显著的扩增或缺失(Figure1F)。
 

 
 
Figure1B-F NSCLC患者突变谱
 
2. NSCLC开放染色质特征

    为了揭示开放染色质区域,利用ATAC-seq对每个肿瘤样本进行测序。采用Jaccard index score评价样本间开放染色质水平的异质性,发现NSCLC样本间异质性比干细胞或分选的血液细胞显著更高(Figure2A)。为了揭示样本特定的peak能否显示功能的特异性,利用少数peaks(minority peaks,在少于20%的样本中出现)对样本进行分类。有意思的是少数peaks与病理类型显著相关,LUSC样本包含更多的minority peaks,另外minority peaks的比例与更高的肿瘤分期、吸烟史、女性显著相关,但与peak数、转移与否和年龄无显著相关性(Figure2B)。
 
    为了探索整体的开放染色质分布作为markers区分NSCLC样本,利用ATAC-seq信号将这些样本聚类成3个cluster(Figure2C)。其中cluster1有4个LUSC和4个LUAD样本组成,这些样本有显著更少的开放染色质peaks以及更高的样本间异质性(Figure2D),同时显示出患者特异性的特征,而不是癌症类型特征。Cluster2主要由LUSC样本组成,开放染色质的TSS上下游2.5kb范围发现了310个基因具有上调的表达,这些基因主要富集在角质化过程(Figure2E),这也是LUSC特定的现象,而非LUAD。Cluster3主要由LUAD样本组成,可以进一步分为3个sub-cluster,这三个sub-cluster有明显不同的开放染色质模式和不同的肿瘤分期(Figure2C)。
 

 
 
Figure2 NSCLC开放染色质图谱

    为了更好地理解瘤内异质性,对一例LUSC患者进行了单细胞ATAC-seq,对质控后的1651个细胞聚类发现7个主要的cluster,其中clutser3的开放染色质特征与bulk样本具有高度一致性,97%的peaks出现在了bulk样本中。因此在单细胞水平上观察到一些开放染色质区域的高度异质性(Figure3)。
 

 
 
Figure3 肿瘤单细胞ATAC-seq展示
 
3. 宽的开放染色质peaksNSCLC关键基因相关

    整合了白血病的ATAC-seq数据进行分析,发现宽的开放染色质peak相关的基因中,310个是NSCLC特异的,368个是Leukemia特异的,337个是共有的(Figure4A)。其中在3个样本中EGFR的几乎整个gene body区被开放染色质区覆盖(Figure4B)。另外,宽的开放染色质peak相关的基因平均表达水平高于其它基因,但是仅38个基因具有显著的差异表达(Figure4C)。宽的开放染色质peak相关的基因其表达水平变异系数更高(Figure4D)。
 

 
 
Figure4 NSCLC宽的开放染色质区域
 
4. Somatic CNV/germline SNV与开放染色质及基因表达间的关系

    文章最后整合多组学数据从somatic CNV的角度分析与开放染色质关系,同时结合基因表达数据发现同时具有somatic CNV和开放染色质的片段与基因表达有显著的相关性,CNV gain其表达水平显著更高,CNV loss其表达水平显著更低(详见原文)。
    另外从QTL的角度整合germline SNV、ATAC数据和基因表达数据发现某些基因的信息,同时与GWAS数据整合分析某些风险位点(详见原文)。
 
总结讨论
 
文章通过整合NSCLC肿瘤组织的多组学数据显示这种类型的数据能够揭示一些基因调控网络,但是样本量的限制使得分析具有一定的局限性!



上海天昊生物科技有限公司 版权所有 沪ICP备17008908号
地址:上海市浦东新区康桥路787号9号楼 邮箱:techsupport@geneskies.com 电话:400-065-6886