目前空间转录组数据剖析面临以下两方面难题:第一,对付空间细胞类型的识别,许多研究仅利用细胞基因表达谱而忽略细胞的空间位置信息。
然而,近年来的研究表明,原来被认为是同质性的细胞类型,根据其在组织中的位置,可以进一步细分为多个亚型。
第二,对付组织模块的创造,当前的方法紧张基于组织内区域的基因空间表达模式的同等性来创造组织模块。
然而,构成组织的不同细胞的基因表达特色可能高度异质化,这些方法未能充分利用最新的单细胞分辨率的空间转录组数据中细胞类型的信息。

清华团队开拓人工智能算法SPACE用于空间转录组数据分析_细胞_空间 智能助手

5月31日,清华大学生命科学学院/构造生物学高精尖创新中央/清华-北大生命科学联合中央张强锋副教授课题组在《细胞·系统》(Cell Systems)杂志在线揭橥题为“基于感知细胞-细胞相互浸染的细胞嵌入在单细胞分辨率空间转录组数据中创造组织模块”(Tissue module discovery in single-cell resolution spatial transcriptomics data via cell-cell interaction-aware cell embedding)的研究论文。
在该研究中,他们开拓了基于图自编码器(Graph autoencoder)深度学习框架的人工智能算法SPACE,可以在空间转录组数据中识别空间细胞亚型和创造组织模块。

SPACE模型框架

SPACE利用图自编码器框架来学习低维的细胞嵌入,该细胞嵌入描述了空间转录组数据中每个细胞自身的基因表达信息以及其与空间临近细胞的相互浸染信息(因此称该细胞嵌入为细胞-细胞相互浸染感知的细胞嵌入,cell-cell interaction-aware cell embedding)。
在该细胞嵌入根本上,SPACE再通过聚类算法识别空间细胞亚型和创造组织模块。
SPACE紧张在以下两个方面差异于现有方法。
首先,SPACE通过两个独立的解码看重构细胞自身的基因表达谱和空间临近图。

其次,SPACE定义了一个感知场比率α,该系数决定了基因表达谱重修丢失与空间临近图重构丢失的相对权重。
这种可调度的系数使SPACE能够将模型的优化重点(根据详细研究须要)转向强调所剖析细胞自身的基因表达特色或空间临近细胞的组织信息,从而识别空间细胞亚型或创造细胞群落,即一种具有可辨识边界且组成细胞类型空间分布的组织模块。
通过利用多个空间转录组数据集对SPACE进行测试,可以表明SPACE创造的细胞群落与人工标注的组织构造在空间分布特色上相似。
特殊地,细胞群落是由其所组成的细胞间相似的近端相互浸染网络而不是同等的基因空间表达模式来定义的。
这种细胞间的近端相互浸染网络可以用于优化基于配体-受体的细胞通讯推断,从而改进对生物过程中细胞间旗子暗记通报与调控的解读。

综上所述,研究职员开拓了一个可以从单细胞分辨率的空间转录组数据中识别空间细胞类型和创造组织模块的空间转录组数据人工智能剖析工具SPACE。
SPACE可用于大规模的空间转录组研究,以理解空间临近细胞之间的相互浸染是如何影响细胞类型和组织模块生物学功能的。

张强锋为论文通讯作者,清华大学生命科学学院2019级博士生李雨哲和博士后张劲松为论文共同第一作者。
沙特阿卜杜拉国王科技大学打算生物学科研中央主任,前百图生科(BioMap)研究院主任AI科学家高欣教授参与互助研究。

研究得到国家重点研究发展操持专项、国家自然科学基金、北京市构造生物学高精尖创新中央、清华-北大生命科学联合中央、清华大学打算平台、上海期智研究院和阿卜杜拉国王科技大学研究管理办公室的支持。

论文链接:

https://www.cell.com/cell-systems/fulltext/S2405-4712(24)00124-8

供稿 | 生命学院