昊为泰生物多年专注于深耕遗传学和基因组学等领域科研特色技术的开发,不断跟进国际先进的科研成果及技术发展,创新研发了许多特色专利技术和领域内前沿的检测服务项目,受到广大专业科研用户的认可和好评。
每年核酸研究(Nucleic Acids Research,IF:16.6)杂志均会发布一系列分子生物学数据库,2025年核酸研究数据库一期包含185篇论文跨越生物学和相关领域。包括73个新数据库,先前发布的101个更新的数据库及其他地方发表的11个数据库[1]。
本期我们将简要介绍今年新发布的单细胞组学相关数据库内容:
CELLxGENE(https://cellxgene.cziscience.com/)可查找、下载、探索、分析、注释和发布单细胞数据集[2]。其中包含了1767个数据集的108.4百万个细胞,共计1014种细胞类型被注释。
以数据库中的差异表达(Differential Expression)分析为例,我们可以人为选择想要比较的组织类型、细胞类型、来源文献及研究疾病,采用数据库分析即可获取不同细胞间的差异表达基因。
HSCGD(http://www.hscgd.com):Human Single Cell Genome Database(人类单细胞基因组数据库)是一个包含所有当前人类单细胞基因组测序数据的数据库[3]。该数据库目前存储了来自63个数据集的74,154个单细胞基因组测序数据。用户可以很容易地找到每个单细胞基因组学研究的测序数据,获取详细信息并下载。
该数据库目前囊括的肿瘤类型数据共有8个癌种,包括乳腺癌、结直肠癌、肺癌、恶性胶质瘤、胃癌、肝癌、前列腺癌及成神经管细胞瘤。
metsDB(https://relab.xidian.edu.cn/metsDB/)是一个整合了bulk转录组测序、单细胞转录组测序和空间转录组数据的肿瘤转移相关数据库[4]。目前的metsDB收录了来自13种癌症类型的1786个Bulk RNA-seq样本,来自17种癌症类型的988,463个单细胞,以及来自10种癌症类型的173,751个区域的45个空间载玻片。
对于Bulk RNA-seq数据,比较了不同转移组的细胞、基因、同种型、基因集、编辑事件和药物反应。对于scRNA-seq数据,区分了不同转移组之间的细胞组分、细胞特异性基因、细胞特异性基因集、细胞相互作用、转录因子调控和轨迹。对于空间转录组学RNA-seq数据,在载玻片中定义了上皮样和间质样区域,并比较了这些区域之间的分子,包括细胞、基因、基因集、细胞相互作用、细胞共定位、邻近区域的细胞和邻近区域的基因。metsDB将成为系统表征与癌症转移相关的转录组变化的独特资源,有利于转移相关的研究。
Pairpot(http://123.207.205.5)是一个为配对单细胞和空间转录组学量身定制的实时Lasso分析数据库[5]。配对单细胞和空间分辨转录组学(SRT)数据相互补充,为了解生物过程和疾病机制提供了深入的见解。Pairpot从299个数据集中收集了99对高质量的配对,包括1,425,656个区域(spots),并创建了关联网络。Pairpot通过整合多个切片并建立单细胞和SRT数据之间的潜在关联来构建配对关系。
在此基础上,Pairpot采用半监督学习,可以对SC-SP对进行实时启发式分析,其中Lasso-View在毫秒内细化用户选择的SRT域,Pair-View根据用户选择的细胞类型实时推断区域的细胞比例,Layer-View使用3D分层布局显示SRT切片。总之,Pairpot提供了有价值的数据库资源和强大的启发式分析,使研究人员能够实时简化单细胞和SRT集成分析。
PerturBase(http://www.perturbase.cn/)是一个单细胞扰动数据分析和可视化的数据库[6]。它整理了来自46项公开研究的122个数据集,涵盖115个单模态和7个多模态数据集,其中包括来自约500万个细胞的24254个遗传和230个化学扰动。PerturBase由“Dataset”和“Perturbation”模块组成,提供对各种分析结果的见解,包括质量控制,数据去噪,差异基因表达分析,扰动效应的功能分析以及扰动之间关系的表征。所有数据集和结果都呈现在用户友好,易于浏览的网页上,并可以通过直观和交互式的图表和表格格式进行可视化。
scCancerExplorer(https://bianlab.cn/scCancerExplorer)是一个探索人泛癌单细胞多组学数据的分析平台[7]。数据库纳入了50个癌种11,596名患者的数据,另外TCGA样本有10,827例。主要包含五个模块,整合多组学分析、单细胞转录组、单细胞表观基因组、单细胞基因组和TCGA分析。
scDrugAct(http://bio-bigdata.hrbmu.edu.cn/scDrugAct/)是一个单细胞药物作用的数据库[8]。目前发布的scDrugAct数据库包含来自34种癌症类型的208个单细胞数据集的3,838,223个细胞,13,857种药物/小分子,17,274种药物相关基因,13,857种药物/小分子与3,838,223个细胞之间的药物-细胞关联,以及10,000种药物与肿瘤微环境中53种细胞类型之间的276,559种关联。为了剖析细胞异质性对药物作用和耐药性的贡献,并确定关键特征,scDrugAct提供了16个灵活的交互工具,便于检索、可视化和分析。
scImmOmics(https://bio.liclab.net/scImmOmics/home)是一个分析已知细胞类型的单细胞多组学免疫数据库[9]。其中数据库包含多物种的已知细胞标签,旨在记录大量高质量的单细胞免疫多组学数据资源,更广泛和全面的细胞/组织类型信息。
当前版本的scImmRef记录了超过290万个带有细胞类型标签的免疫细胞,涉及131种细胞类型和47种组织。这些数据集来自NCBI、HCA、EMBL-EBI、Github、Zendo和CellTypist,包括scRNA-seq、scTCR-seq、scBCR-seq、scATAC-seq、CITE-seq、ECCITE-seq和scCUT&Tag-pro。值得注意的是,scImmOmics提供了丰富的调控信息,如聚类、基因表达、差异表达基因及其功能注释、分化轨迹、细胞间通讯、共表达网络及其特征基因、蛋白质表达、组蛋白修饰状态、差异染色质可及区域和转录因子的z-score。此外,scImmRef还提供克隆丰度、不同细胞类型的克隆型分布和对细胞因子的免疫反应分析。总之,scImmRef是在单细胞水平上阐明免疫细胞异质性、免疫应答和免疫治疗的有价值和有效的资源。
scLTdb(https://scltdb.com)是一个单细胞谱系示踪数据库[10]。scLTdb具有多功能模块,用于分析基因表达,克隆组成,命运结果,谱系关系和细胞命运决定的潜在调节因子。scLTdb收集了109个数据集,包括3个物种、13个组织来源、280万个细胞和36种scLT技术。scLTdb提供:1. 按物种、组织来源、条形码类型和技术搜索和查询scLT数据集。2. 通过三个交互模块,包括单细胞模块、谱系示踪模块和集成模块,重新分析和可视化scLT数据集。3. 下载h5ad和rds格式的处理良好的scLT数据集。4. 分析单细胞谱系示踪和细胞条形码数据的在线工具。5. 用户使用scLTdb的分步教程,用户可以通过点击导航栏上的教程按钮来访问教程。
scMMO-atlas(https://www.biosino.org/scMMO-atlas/)是一个单细胞多模态组学数据库[11]。作为单细胞多模态组学数据的综合存储库,涵盖基因表达,染色质可及性,蛋白质和各种其他组学数据。这个广泛的资源包括来自3,168,824个人类和小鼠细胞的信息,跨越27个细胞系/器官/组织,70个数据集。
scProAtlas(https://relab.xidian.edu.cn/scProAtlas/#/)是一个空间蛋白组影像数据库[12]。当前版本的scProAtlas利用8种单细胞空间蛋白质组学成像技术,涵盖了来自15种人体组织的1,346个区域的17,468,394个细胞。为了揭示这些组织之间的空间模式,进行了细胞类型注释、邻域分析和空间细胞相互作用网络分析。此外,将单细胞空间蛋白质组学数据与单细胞转录组学数据相结合,以提供更完整的细胞机制和分子相互作用的图像。这使得能够在每个数据集中识别空间可变的基因及其相关途径。这些综合分析为分子的复杂空间动力学及其在单细胞分辨率的组织发生和疾病发展中的作用提供了独特的见解。
scTML(http://sctml.xglab.tech/)是一个单细胞肿瘤突变数据库[13]。scTML提供了多种突变类型的泛癌单细胞景观,用于研究单细胞水平的突变模式,并探索它们与基因表达和表型信息的关系。
scTWASAtlas(https://ngdc.cncb.ac.cn/sctwas/)是一个单细胞转录组范围关联研究的数据库[14]。scTWAS Atlas通过文献整理和数据分析对细胞水平的转录组关联进行编目和整合,并提供丰富的可视化和分析工具,以促进单细胞解决方案下TWAS关联的进一步研究。
2.Program CZICS, Abdulla S, Aevermann B, Assis P, Badajoz S, Bell SM, Bezzi E, Cakir B, Chaffer J, Chambers S et al: CZ CELLxGENE Discover: a single-cell data platform for scalable exploration, analysis and modeling of aggregated data. Nucleic Acids Res 2025, 53(D1):D886-D900.
3.Fu J, He S, Yang Y, Chen Z, Qiao Y, Lu N, Lu Z, Tu J: HSCGD: a comprehensive database of single-cell whole-genome data and metadata. Nucleic Acids Res 2025, 53(D1):D1029-D1038.
4.Wu S, Zhang J, Wang Y, Qin X, Zhang Z, Lu Z, Kim P, Zhou X, Huang L: metsDB: a knowledgebase of cancer metastasis at bulk, single-cell and spatial levels. Nucleic Acids Res 2025, 53(D1):D1427-D1434.
5.Ruan Z, Lin F, Zhang Z, Cao J, Xiang W, Wei X, Liu J: Pairpot: a database with real-time lasso-based analysis tailored for paired single-cell and spatial transcriptomics. Nucleic Acids Res 2025, 53(D1):D1087-D1098.
6.Wei Z, Si D, Duan B, Gao Y, Yu Q, Zhang Z, Guo L, Liu Q: PerturBase: a comprehensive database for single-cell perturbation data analysis and visualization. Nucleic Acids Res 2025, 53(D1):D1099-D1111.
7.Huang C, Liu Z, Guo Y, Wang W, Yuan Z, Guan Y, Pan D, Hu Z, Sun L, Fu Z et al: scCancerExplorer: a comprehensive database for interactively exploring single-cell multi-omics data of human pan-cancer. Nucleic Acids Res 2025, 53(D1):D1526-D1535.
8.Xu Y, Zhang Y, Song K, Liu J, Zhao R, Zhang X, Pei L, Li M, Chen Z, Zhang C et al: ScDrugAct: a comprehensive database to dissect tumor microenvironment cell heterogeneity contributing to drug action and resistance across human cancers. Nucleic Acids Res 2025, 53(D1):D1536-D1546.
9.Li YY, Zhou LW, Qian FC, Fang QL, Yu ZM, Cui T, Dong FJ, Cai FH, Yu TT, Li LD et al: scImmOmics: a manually curated resource of single-cell multi-omics immune data. Nucleic Acids Res 2025, 53(D1):D1162-D1172.
10.Jiang J, Ye X, Kong Y, Guo C, Zhang M, Cao F, Zhang Y, Pei W: scLTdb: a comprehensive single-cell lineage tracing database. Nucleic Acids Res 2025, 53(D1):D1173-D1185.
11.Cheng W, Yin C, Yu S, Chen X, Hong N, Jin W: scMMO-atlas: a single cell multimodal omics atlas and portal for exploring fine cell heterogeneity and cell dynamics. Nucleic Acids Res 2025, 53(D1):D1186-D1194.
12.Wang T, Chen X, Han Y, Yi J, Liu X, Kim P, Huang L, Huang K, Zhou X: scProAtlas: an atlas of multiplexed single-cell spatial proteomics imaging in human tissues. Nucleic Acids Res 2025, 53(D1):D582-D594.
13.Li H, Ma T, Zhao Z, Chen Y, Xi X, Zhao X, Zhou X, Gao Y, Wei L, Zhang X: scTML: a pan-cancer single-cell landscape of multiple mutation types. Nucleic Acids Res 2025, 53(D1):D1547-D1556.
14.Mai J, Qian Q, Gao H, Fan Z, Zeng J, Xiao J: scTWAS Atlas: an integrative knowledgebase of single-cell transcriptome-wide association studies. Nucleic Acids Res 2025, 53(D1):D1195-D1204.
copyright © 2008-2023 昊为泰 reserved. ICP备案序号:沪ICP备18028200号-1沪公网安备 31011502016782号