人类细胞图谱的计算技术-细胞类型注释-技术前沿-资讯-生物在线

人类细胞图谱的计算技术-细胞类型注释

作者:上海伯豪生物技术有限公司 2024-11-29T00:00 (访问量:5937)

HCA项目于2016年启动,已经对数亿个单细胞进行了分析,发表了约440项研究,建立了数十个湿实验室和计算程序。众所周知,在研究人员收集单细胞数据并将其细化为细胞图谱的过程中,一项关键任务是对每种细胞类型进行表征,标记或注释。这通常是一项非常耗时、繁重的任务。今年在《nature portfolio》杂志上发表了20多篇论文。这些论文突出了该项目在细胞命运映射、数据整合和预测建模方面的成就。下面就2种重要的细胞类型注释和鉴定方法进行介绍:

PopV(popular Vote)

PopV工具将8个自动化的细胞类型注释工具(random forest (RF), support vector machine (SVM), scANVI, OnClass, Celltypist,scVI,BBKNN和Scanorama)整合到一个平台中,未来还支持添加更多工具。PopV可以通过对输入的单细胞RNA测序数据的细胞“身份”进行“投票”来鉴定细胞类型。对于任何给定的细胞,如果8个工具的注释结果是一致,那么该数据的细胞类型就是确认的,如果8个工具的投票结果有分歧,popV会给出“不确定性评分”,使用者可以通过该评分来判断注释结果的信任程度。除了8种不同的细胞类型注释方法外,PopV还拥有一个大的数据集——Tabula Sapiens用来进行训练,Tabula Sapiens是一个人类细胞图谱,覆盖了代表15个人24个器官的近50万个细胞。研究人员在人类肺细胞图谱数据库中对PopV进行了测试,结果显示popV的预测与大多数注释一致,并且比任何单一的计算注释方法都更准确。PopV也将被纳入HCA细胞注释平台的用户界面,在该界面中,科学家将能够在分类细胞类型时查看popV的预测。

图 用于自动化细胞格类型标注的popV框架

SCimilarity

另一款用来检测细胞“相似性”的工具SCimilarity也被开发出来。就像基因学家使用BLAST算法来寻找相关的基因序列一样。SCimilarity 可以帮助研究人员“弄清楚两个细胞是否相似。该工具开发人员给计算机输入了5000万个三联细胞,其中每个三联细胞包含两个相似的细胞和一个异常的细胞,直到软件学会区分匹配细胞类型的特征。每个细胞最初是由大约20000个人类基因的表达来定义的,但该程序将这些基因压缩成128个关键特征来识别细胞,该数据库涵盖了近400个数据集的2300多万个细胞,搜索只需几秒钟。为了测试相似性,研究人员寻找了含有与纤维化肺组织中发现的某些免疫细胞相似的细胞的数据集。通过对17项涉及近42,000个细胞的体外和体外研究的搜索,该团队发现,在3D水凝胶系统中生长的用于制造血液干细胞白细胞与之相匹配。

图 SCimilaruty工作流

 

参考文献:

1. Ergen C, Xing G, Xu C, Kim M, Jayasuriya M, McGeever E, Oliveira Pisco A, Streets A, Yosef N. Consensus prediction of cell type labels in single-cell data with popV. Nat Genet. 2024 Nov 20.

2. Heimberg G, Kuo T, DePianto DJ, Salem O, Heigl T, Diamant N, Scalia G, Biancalani T, Turley SJ, Rock JR, Corrada Bravo H, Kaminker J, Vander Heiden JA, Regev A. A cell atlas foundation model for scalable search of similar human cells. Nature. 2024 Nov 20.

 

上海伯豪生物技术有限公司 商家主页

地 址: 浦东新区张江高科技园区李冰路151号

联系人: 付先生

电 话: 021-5895-5370

传 真: 021-51320266

Email:market@shbio.com

相关咨询
ADVERTISEMENT