搜索
全国服务热线 020-31100174IF 16.6 Nature Communications│单细胞RNA测序数据跨物种整合的基准策略

IF 16.6 Nature Communications│单细胞RNA测序数据跨物种整合的基准策略

0.png

前言

2023年10月14日,英国剑桥大学的宋余姚等在Nature Communications上发表了题为“Benchmarking strategies for cross-species integration of single-cell RNA sequencing data”的研究文章。该研究通过观察不同整合策略在具有特定考察点的任务中的表现,为跨物种整合目标的适当策略选择提供了指导。


背景介绍

动物细胞表现出明显的多样性,具有跨物种的基本统一性。最近,单细胞转录组测序(scRNA-seq)和单核转录组测序(snRNA-seq)在物种多样性研究中得到了应用,从数百万个单个细胞的转录组图谱中生成了完整的体细胞图谱。通过比较不同物种的细胞表达谱,可以深入了解器官和细胞类型的起源和进化,突出物种特异性的表达模式,并进一步揭示细胞类型如何在健康和疾病中执行其功能。

图文解析


1.png

图1

要点1:

图1所示:BENGAL管道采用28种策略进行跨物种整合并对整合结果进行评估。2.png

图2

要点2:

a.为了提供策略性能的概述,使用7个参考任务计算了所有策略的综合得分的平均值和标准差。b.主要的差异是由集成算法而不是同源方法给出的。实现成功整合的策略在各任务间基本保持一致,而相对的物种混合和生物保护得分则存在差异。总的来说,scANVI,scVI,SeuratV4 CCA,SeuratV4 RPCA,Harmony和fastMNN在全板上表现良好。研究人员分析了策略的相对物种混合和生物保守性。在所有任务中,研究人员观察到大多数策略在物种混合和生物保守之间进行了权衡。3.png

图3

要点3:

a.展示了7个算例任务中不同策略的ALCS,按照增加整合物种之间的最大分歧时间的顺序。b.作为一个例子,研究人员展示了海马_hs_mu_ss任务的scANVI HE和LIGER O2O整合的一致流形近似和投影(UMAP)可视化。4.png

图4

要点4:

a-f.研究人员展示了BENGAL,从人和小鼠胰腺(Pancreas_hs_mm),以及人、恒河猴和猪的海马-内嗅系统(海马_hs_mu_ss)之间的整合开始。5.png

图5

要点5:

a-b.基于绘制的斑马鱼和爪蟾胚胎发育数据集之间的同源细胞类型和受精后的记录时间(HPF),研究人员研究了各种整合输出结果的物种混合和生物保守性。

研究人员在Embryo_dr_xt任务中观察到跨策略的成功率总体较低。获得比未整合数据更高的整合得分的算法包括scVI/scANVI、SeuratV4方法和Harmony,它们具有可比的物种混合和生物保护得分。然而,scVI/sc ANVI和Seurat V4等方法显示了更明确的发育时期沿包埋的进展。这一观察表明,SAMap侧重于优先考虑定义身份的表达特征,这些特征将进化相关的细胞类型联系在一起。6.png

图6

要点6:

a-b.整合后,scANVI达到了最高的综合得分(0.62-0.69,每个任务的单独指标未缩放,用于跨任务比较。这同样适用于以下分数)。这主要得益于其较高的生物保护评分(0.70-0.83)。另一方面,SeuratV4 RPCA方法对4个任务的物种混合得分最高(0.46-0.54)。在所有任务中,scanorama、LIGER和LIGER unmf的综合得分低于未综合的数据。总的来说,物种的添加并不影响积分算法和物种混合分数的相对性能,从这些标准来看,突出了它们的鲁棒性。相比之下,生物保护得分和ALCS显著下降,表明当远处物种加入到整合中时,细胞类型特异性的生物信号普遍丢失。c.由于22个细胞类型中只有8个是所有物种共有的,研究人员利用这个机会研究了不同的策略如何使用孤立标签F1(iso_F1)分数处理在少数数据集中发现的细胞类型。研究人员发现基于最近邻的方法有矫枉过正的倾向,导致相似的细胞类型合并,特别是当更多的物种参与整合时。d-e.研究人员展示了4个任务仅有一对一直系同源数据的Seurat V4 CCA集成。7.png

图7

要点7:

如图7所示:研究人员注意到,随着在心脏任务中加入进化上更远的物种,对于实现了成功整合的方法,整体的注释转移质量并没有下降。


全文小结

综上所述,本研究测试了28种跨物种单细胞转录组数据整合策略,涵盖了4种通过同源性匹配跨物种基因的方法和10种整合算法。基于一致的细胞类型同源性和统一的本体注释,研究人员使用4个指标来评估物种混合程度,6个指标用于评估生物保守性。本研究还提供了以下免费可用的工具:BENGAL,一个用于跨物种scRNA-seq数据整合和整合结果评估的Nextflow管道;ALCS是一种以跨物种整合为中心的生物保守性度量,用于量化细胞类型可区分性的损失。

参考文献:Song, Y., Miao, Z., Brazma, A. et al. Benchmarking strategies for cross-species integration of single-cell RNA sequencing data. Nat Commun 14, 6495 (2023). https://doi.org/10.1038/s41467-023-41855-w


初源云医疗
初源云医疗专注于医学科研版块,业务涵盖细胞基因修饰、病毒包装、合成生物学、单细胞测序、蛋白质组学、基因编辑动物、药品上市后药效研究等科研技术服务和成果转化。 基石启航医疗与香港基石生物、探罕科学研究有限公司、松诺生物及香港科技大学、沈阳医学院等国内外知名机构有着深度合作关系,旨在促进资源共享和技术交流,加速研究成果的转化和应用
资讯与资源
新媒体矩阵
合作伙伴