中文

English

俄罗斯专享会284:简化生物医疗空间数据分析的降维聚类工具

发布时间:2025-03-12   信息来源:彭瑶黛

目前,常用的空间转录组降维聚类方法,如主成分分析(PCA)和非负矩阵分解(NMF),大多是基于单细胞数据开发的,这使得它们不一定完全适用空间转录组数据。这些传统的降维聚类方法通常未能充分利用空间转录组特有的组织空间定位信息,而仅依靠表达谱进行聚类。然而,在生物组织中,相邻区域往往具有相似的细胞组成和基因表达模式。因此,将空间位置信息整合到降维聚类中能够更好地反映生物实际状态,从而实现更精确的空间聚类。

俄罗斯专享会284:简化生物医疗空间数据分析的降维聚类工具

基于这一观点,SpatialPCA被开发为一种新的空间转录组降维聚类工具。该工具采用了空间概率PCA(spatial probabilistic PCA)方法,能够明确地模拟组织位置之间的空间相关性,并在降维数据中保留原始空间数据的邻近性。SpatialPCA将空间定位信息作为额外的输入,通过核矩阵来模拟组织位置之间的空间结构。所生成的降维主成分,因其包含空间结构信息,被称为空间主成分。具体而言,该方法同时利用基因表达矩阵和位置信息矩阵,将基因表达矩阵构建为潜在因子的函数模型。同时,通过位置信息矩阵构建核矩阵,以明确潜在因子的空间结构相关信息。

在相关研究中,以背外侧前额叶皮层(DLPFC)作为模拟数据来源,通过手动分割不同皮层,确定了10000个特定细胞类型的位置,并获得了这些细胞的单细胞表达数据,模拟了四种不同的细胞组成情况。这些手工构建的空间转录组数据使得SpatialPCA在模拟数据测试中,展现出了优于现有多种空间聚类方法的检测性能。

在真实数据的测试中,研究人员选择了人类DLPFC的Visium空间转录组数据,对SpatialPCA及其他工具(如BayesSpace、SpaGCN、HMRF、stLearn、PCA、NMF)进行了平行测试。结果显示,SpatialPCA生成的空间聚类结果最接近实际的生物结构,其预测的精确性和空间域结构连续性(CHAOS分数越低表示连续性越高)也处于各工具之中最高水平。为了进一步确认SpatialPCA的技术通用性,研究人员还在其它技术(如Slide-seq、Slide-seq V2)生成的鼠脑组织空间转录组数据上进行了测试,结果同样显示,SpatialPCA的聚类结果与实际情况吻合得更好。为验证其样本普适性,利用HER2阳性乳腺肿瘤样本进行测评,结果继续显示SpatialPCA在聚类精确性上更具优势。

由于SpatialPCA计算得到的空间主成分同时包含空间信息与基因表达信息,因此可以利用这一特性,通过一些单细胞转录组分析工具进行后续分析。研究通过使用Slingshot对肿瘤组织的空间转录组数据进行轨迹推断,得出了一条从肿瘤区域指向肿瘤周围再到正常组织的轨迹,计算出的伪时间相关基因显示富集于免疫反应、细胞介导免疫和吞噬识别通路,强调了它们在癌症进展、肿瘤侵袭和转移中的重要性。

此外,基于SpatialPCA的建模框架,可以在新的空间位置上推断基因表达水平,同时通过低分辨率样本数据构建高分辨率的空间图谱。在肿瘤组织的测试中,SpatialPCA生成的高分辨率空间图谱展示了连续和平滑的特征,精确定位了不同组织区域间的边界,并细化了紧邻肿瘤和免疫区域之外的肿瘤周围区域,体现了SpatialPCA在精细结构方面的优势。

总之,SpatialPCA是一款专为空间转录组数据降维聚类分析所设计的工具。如果您在使用传统方法对空间数据进行分群聚类时效果不理想,不妨尝试使用俄罗斯专享会284推出的SpatialPCA,或许可以带来意想不到的科研突破。