在生物医学研究领域,常规的多组学技术已经被广泛引入,以深入探讨疾病发展和组织发育等重要课题。通过在单细胞层面从相同或相似来源的不同细胞当中提取多种组学信息,我们可以利用单细胞转录组分析鉴定细胞类型,并关联至其他相似细胞的不同组学层面,进而发现新的细胞亚群和生物学机制。随着测序技术的飞速发展,现在可以在单细胞分辨率下捕捉同一细胞中的DNA、mRNA、表观基因组和蛋白质组信息。这种复杂数据的整合已促成了多种生物信息学算法的开发。
本章节作者回顾了以下几个方面:(1)单细胞多组学技术的发展,尤其是以转录组为核心的多组学技术;(2)整合多组学数据的分析方法和工具的最新进展,包括对未配对和配对多组学数据集的应用和算法;(3)在单细胞多组学整合分析基准研究中数据整合方法的性能评估。
近年来,众多单细胞测序方法被开发出来,用于捕获基因组DNA(gDNA)、转录组、蛋白质组和表观基因组等信息。例如,G&T-seq和DR-seq等技术都可以在单个细胞中同步测量mRNA和gDNA。而通过亚硫酸氢盐(BS)处理的方法,也可分析单细胞的DNA甲基化。不同的单细胞多组学测序技术,例如scM&T-seq和scMT-seq,结合了RNA和gDNA的甲基化信息。此外,研究者们还开发了多个联合检测染色质可及性和转录组的单细胞多组学高通量方法。
在蛋白组层面,除了关注RNA和DNA的单细胞多组学以外,研究者们同样开发了能同时测量同一细胞中RNA和蛋白质的技术,如PEA/STA和PLAYR方法,后者实际上实现了单细胞水平上对多种转录物和蛋白质的定量分析。 这些技术不仅提高了检测效率,还大大增加了数据的丰富性。
基于这些新兴技术,越来越多的方法被提出以检测同一个细胞中的多个组学数据。然而,多组学数据整合的复杂性,特别是由于数据维度高、稀疏度高和技术变量复杂性,给整合分析带来了诸多挑战。为此,多个算法不断被开发,帮助研究者克服这些难点。本文探讨了目前多组学整合分析算法的分类,包括基于锚点选择的水平整合、垂直整合和马赛克整合策略等。同时,还将这些工具按功能分为配对整合和非配对整合工具,并深入分析了各种工具在特定组学整合任务中的应用。
对于已发布的单细胞多组学整合工具的基准研究,诸如Luecken等人的评估研究为用户提供了一个稳定而全面的框架,以评估整合算法性能。尽管针对不同组学间数据的整合任务仍存在诸多挑战,但这为我们理解细胞进程和推动个性化医疗的发展提供了丰富的数据与有力的支持。
总而言之,随着实验技术和生物信息学算法的不断进步,单细胞多组学技术将在生物医疗领域中开辟新的研究视角,助力更深刻的生物学洞察和医学发现。正因如此,环亚集团致力于推动多组学技术的发展与应用,以期在不久的将来实现更为精准的疾病治疗与干预方案。