细胞表面蛋白是临床上重要的作用靶点,在细胞通讯、信号传导和稳态维持中起着关键作用。然而,目前针对这些靶点生成高亲和力分子探针(如核酸适体)的方法仍然有限。传统方法通量低,且常在筛选过程中破坏蛋白质的天然构象,导致大量靶点未被充分探索,从而阻碍了基于适体的诊断与治疗开发。
鉴于此,中国科学院杭州医学研究所谭蔚泓院士、吴芩研究员等开发了一种名为SPARK-seq(单细胞扰动驱动的适体识别与动力学测序)的高通量平台。该平台将CRISPR基因扰动与单细胞转录组及适体测序相结合,可在天然细胞环境中高效、系统地绘制适体‑靶标相互作用图谱。通过一次实验,SPARK-seq成功将5535种不同的适体映射到8个表面蛋白上,覆盖了超过两个数量级的蛋白丰度范围,并能够区分高度同源的旁系同源蛋白。该平台还可提供动力学信息,优先筛选出解离速率慢的适体,并借助深度学习框架SPARTA进行适体预测与变体生成,为精准诊断与治疗提供了强大的分子工具开发平台。相关研究成果以题为“SPARK-seq: A high-throughput platform for aptamer discovery and kinetic profiling”发表在最新一期《science》上,罗国焰、宋佳为论文共同第一作者。
![]()
【SPARK-seq工作流程】
SPARK-seq整合了多重CRISPR介导的基因敲除与单细胞RNA测序。首先,研究人员设计了一个与单细胞测序兼容的适体文库,其核心为46个随机核苷酸区域,两端分别带有32 nt的5’ PCR手柄和22 nt的3’捕获序列(图1A)。经过四轮Cell-SELEX筛选,获得了与靶细胞特异性结合的富集适体文库(图1B)。随后,该文库与经过CRISPR敲除不同表面蛋白的混合细胞群共同孵育,并进行10X Genomics 5’端测序。在此检测中,gRNA、适体和mRNA分别通过CRISPR捕获引物、模板转换寡核苷酸(TSO)和poly(T)序列被捕获(图1C)。测序后,通过识别和校正每个组学层的细胞条形码,将每个细胞及其对应的扰动与适体结合谱关联起来(图1D,图1E)。
![]()
图 1. SPARK-seq 工作流程概述
【概念验证】
为验证SPARK-seq能否有效建立基因敲除、细胞表型与适体结合之间的直接关联,研究团队以蛋白酪氨酸激酶7(PTK7)为靶点进行了概念验证。使用PTK7特异性适体sgc8c,在人和小鼠细胞系中进行了CRISPR敲除。Western blot和流式细胞术证实PTK7敲除细胞中PTK7表达及sgc8c结合均显著下降(图2A,图2B)。经过序列修饰的sgc8c-S在SPARK-seq中同时分析了PTK7 gRNA、mRNA和适体结合信号(图2C)。单细胞转录组UMAP图谱清晰区分了人和小鼠细胞(图2D),而sgc8c-S结合谱显示,不含PTK7 gRNA的细胞结合信号高,表达PTK7 gRNA的细胞结合信号显著降低(图2E-图2G),证实了SPARK-seq在单细胞水平关联遗传扰动与适体结合的能力。
![]()
图 2. SPARK-seq 与 SGC8c 适体的概念验证
【SPARK-seq绘制适体‑靶标相互作用图谱】
为探索SPARK-seq能否对混合遗传扰动细胞群实现高通量适体靶标识别,研究人员对SUM159PT细胞进行了四轮Cell-SELEX筛选,获得了富集文库R4(图1B)。通过pull-down联合质谱分析筛选回合中的潜在靶标,最终选择了13个膜蛋白进行CRISPR扰动(每个蛋白3个不同的gRNA)。将混合扰动细胞群与R4文库孵育后进行SPARK-seq分析。经过数据质控,最终保留了8466个高质量单细胞,涉及34个不同的gRNA表达群体。对适体序列进行分析,从4.027×10⁷个独特序列中选取了占总读数68.84%的前10,000个序列进行下游分析。通过BLAST和马尔可夫聚类(MCL)算法将这些序列归类为1906个适体家族(图3A,图3B)。SPARTA算法通过结合结合差异计算、质量控制与评分系统,最终成功识别出12个适体家族与9个不同扰动细胞群之间的特异性结合差异(图3C-图3F)。例如,家族5、13、17靶向CDCPI;家族3靶向ITGA3/ITGB1;家族2、6、7靶向NRP1等(图3G)。
![]()
图 3. 高通量适配体-靶点定位流程
【适体‑靶标相互作用的验证】
为验证SPARK-seq/SPARTA预测的相互作用,研究人员通过流式细胞术、表面等离子体共振(SPR)和微量热泳动(MST)等多种正交方法进行了确认。以PTK7靶向适体为例,Apt-1-1和Apt-15-27均能特异性结合表达PTK7的细胞,而在PTK7敲除细胞中结合丧失(图4B)。SPR和MST测定证实其对PTK7蛋白具有纳摩尔级的亲和力(图4C)。类似地,针对CDCPI、NRP1、NRP2等靶点的适体也通过了验证(图4D-图4I,图4Y)。研究还发现了多靶点结合的适体,如家族3的Apt-3-3同时需要ITGA3和ITGB1才能结合(图4N,图4O),家族4的Apt-4-5能同时结合PTPRD、PTPRF和PTPRS三个高度同源的蛋白(图4Q,图4T,图4W,图4R,图4U,图4X)。最终,SPARK-seq成功绘制了5535个适体序列与8个表面蛋白(PTK7、ITGA3、CDCPI、NRP1、NRP2、PTPRD、PTPRF、PTPRS)之间的相互作用图谱(图4Z)。
![]()
图 4. 适配体靶点验证
【适体特异性的正交验证】
通过流式竞争实验、生物素化适体pull-down结合免疫印迹以及SPR交叉结合实验等多层次验证,证实了SPARK-seq衍生适体具有高度的分子特异性(图5A,图5B)。例如,尽管NRP1和NRP2结构高度相似(图5C),但SPARK-seq鉴定出了分别特异性结合NRP1或NRP2且无交叉反应的适体(图5D)。NRP1适体能竞争性阻断VEGF165的结合,而NRP2适体则结合在一个不干扰VEGF165、VEGF-C或TGF-β1结合的非经典位点上(图5E,图5F)。验证的8个靶标在等电点、疏水性、结构域组成和细胞表面表达丰度上呈现广泛差异(图5G),表明SPARK-seq能够发现针对表达量跨越两个数量级以上、具有不同理化特性的细胞表面蛋白的适体,其基于单细胞差异筛选的策略相比传统方法更能发现如CDCPI等可能被常规生化技术遗漏的靶标。
![]()
图 5. 适配体特异性验证
【SPARK-seq优先筛选慢解离速率适体】
研究发现,SPARK-seq的富集偏好与适体的解离速率(koff)强相关,而非平衡亲和力(KD)。对于靶向PTK7的适体,其结合差异(‑log₂FC)与koff在流式细胞术、SPR和实时相互作用细胞术(RT‑IC)中均显示出强相关性(R²分别为0.84、0.88、0.87),而与KD相关性弱(图6A-图6F)。这一规律在其他靶点如CDCPI、NRP1、NRP2、PTPRF中也得到证实(图6G-图6J)。与传统筛选方法倾向于选择拷贝数最高的适体不同,SPARK-seq筛选出的具有最高‑log₂FC值的适体通常具有显著更慢的解离速率(图6K-图6P),这对于需要长时间靶标占据的治疗和诊断应用至关重要。
![]()
图 6. 鉴定具有明显解离动力学的适配体
【总结与展望】
SPARK-seq通过整合CRISPR基因扰动、单细胞转录组与适体测序,建立了一个能够在天然细胞环境中高通量、高特异性鉴定适体‑靶标相互作用并解析其动力学的强大平台。它不仅克服了传统方法对高丰度蛋白的偏好和PCR偏倚,还能有效区分同源蛋白并优先筛选具有慢解离特性的适体,为开发更优的诊断和治疗性适体提供了新范式。未来,通过使用化学修饰文库、更高通量的平台、优化的CRISPR策略以及竞争性筛选,SPARK-seq有望进一步扩展其应用范围,例如通过基因组规模的CRISPR筛选系统绘制适体与未知表面蛋白的相互作用图谱,或通过细胞透化技术探索细胞内靶点,从而推动“适体组学”发展和精准医学的进步。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.