在生物学研究与工程领域,从头构建全新的合成DNA序列至关重要。然而,当前合成复杂长链DNA及其文库的能力,远落后于DNA测序与编辑技术的发展。现有所有DNA组装技术都依赖最终构建体中的DNA序列信息来指导DNA分子间的连接,导致无法在不影响最终序列的前提下对组装指令进行深度优化,从而严重限制了合成结构的效率、尺寸与复杂度。
近日,加州理工学院王开航教授团队开发出一种名为Sidewinder的新型DNA组装技术,该技术利用DNA三向连接结构,成功将指导组装的信息与最终组装序列分离开来,实现了真正独立于序列的DNA组装。研究者展示了Sidewinder的强大能力:高稳健且精确地完成了40片段的多重组装、高GC含量与高重复序列的复杂DNA构建、同一反应中多个不同基因的并行组装,以及在整个基因长度上覆盖44万余种变体的组合文库构建。该技术在连接点的误接率仅为约百万分之一。相关内容以“Construction of complex and diverse DNA sequences using DNA three-way junctions”为题发表在《
Nature》上。
![]()
Sidewinder技术的核心在于其与所有传统技术的根本区别:它利用第三个独特的螺旋中编码的信息,通过形成DNA三向连接来指导DNA片段间的组装。该三向连接由“ 立足点”( foothold)与“条形码”共同作用形成。其中,条形码序列不进入最终产物,从而解除了对组装位置、序列内容及片段数量的限制。实验证明,只有同时具备互补条形码和互补立足点的片段才能成功连接,确保了组装的高特异性。
![]()
图1 | Sidewinder利用三向连接实现真正独立于序列的DNA组装。 a. Sidewinder通过形成三向连接指导DNA组装。Sidewinder片段包含短 foothold对和长的独特条形码对。DNA组装由条形码对引导。条形码对的结合将两个片段拉近,并由 foothold对进一步稳定以形成三向连接。 foothold被连接到相邻片段,不可逆地将两个片段连接。随后移除条形码螺旋,恢复双向连接,实现无缝组装。 b. 两片段连接需要互补的 foothold和条形码对。用荧光染料Cy3标记的片段Y与四种可能的片段X之一进行组装。 c. 图b中四个反应及对照在不染色的TBE-尿素变性凝胶上电泳,仅追踪含荧光团分子的迁移。凝胶通过未连接产物与连接产物迁移差异展示连接效率,连接产物仅出现在条件完全匹配的泳道。
在规模化应用方面,Sidewinder展现出卓越性能。研究人员成功将编码LuxABCDE操纵子的DNA序列拆分为5、10、20乃至40个片段进行组装,均获得单一、清晰的目标条带,无错误组装迹象。相比之下,传统的聚合酶循环组装等方法在超过5个片段后即告失败。对40片段组装产物的纳米孔测序分析显示,超过96%的读段为正确组装的完整产物。特别地,Sidewinder还能攻克传统方法难以处理的复杂序列。例如,研究人员成功组装了GC含量高达70%(局部达95%)的人类载脂蛋白E基因编码序列,以及一段具有高度重复序列的丝蛋白基因片段。即使在故意设计为所有片段 foothold序列完全相同的极端条件下,Sidewinder依然能高效完成正确组装,突显了其条形码引导机制的优势。
![]()
图2 | Sidewinder以高精度可靠组装大型多片段构建体。 a. Sidewinder片段异源双链由单链条形码与编码寡核苷酸退火形成。 b. Sidewinder片段单独处理后混合进行组装反应。片段通过其高保真条形码的引导与正确伙伴结合,并在形成三向连接后被连接。所有条形码寡核苷酸通过DNA聚合酶延伸引物被置换或破坏,从而在整个组装体中恢复双向连接。此步骤可整合到选择性PCR中进一步扩增产物。 c. DNA琼脂糖凝胶展示PCR产物,比较了行业标准的寡核苷酸组装技术与Sidewinder随组装规模和片段数量增加的表现。仅Sidewinder成功完成了40片段组装。 d. 对40片段Sidewinder组装产物的纳米孔测序读段分析饼图,显示准确组装与副产物的比例。 e. 分析40片段组装纳米孔测序数据中所有可能的连接组合,比较正确与错误连接的数量。
![]()
图3 | Sidewinder组装复杂DNA序列(高GC含量与高重复序列)。 a. 人载脂蛋白E基因的GC含量分布图。 b. 12片段Sidewinder组装产物的DNA琼脂糖凝胶图,显示单一纯净条带。 c. 对上述产物的纳米孔测序分析饼图。 d. 对高GC含量组装产物的连接点分析,显示所有检测到的连接均为正确连接。 e. 采用完全相同 foothold序列的5片段重复序列组装设计示意图。 f. 该5片段相同 foothold组装产物的DNA琼脂糖凝胶图,显示强目标条带。 g. 对该组装产物的纳米孔测序分析饼图。 h. 对该组装产物的连接点分析,显示在极端条件下仍具有极高的连接准确性。
该技术的另一大亮点是能够在同一反应管中并行组装多个不同的构建体。研究者将编码mScarlet、mGL和aeBlue三种不同颜色表型标记的基因片段混合,在“一锅法”反应中同时进行组装,并通过选择性扩增分别获得单一、纯净的目标产物。测序分析证实了各自组装的高保真度,转化后的菌落也仅呈现预期的颜色。
![]()
图4 | Sidewinder在单反应中独立并行组装多个不同构建体且保真度高。 a. 三种对应不同表型标记的十片段组装Sidewinder片段在同一反应管中混合并行组装。 b. DNA琼脂糖凝胶显示各单独构建体以及三者混合物的最终PCR产物,均有单一强目标条带。 c. 对单独及混合组装的纳米孔测序分析饼图。 d. 对单独扩增构建体的纳米孔测序数据进行连接点分析。 e. 组装产物克隆转化后,混合池平板在环境光与蓝光叠加下的显色照片。
此外,Sidewinder在构建大规模组合DNA文库方面潜力巨大。研究团队将荧光蛋白eGFP的基因分成10个片段,并在17个位点预定义密码子变异,构建了一个理论容量为442,368种变体的组合文库。PacBio高通量测序分析显示,文库覆盖了超过91.7%的可能组合,且连接点误接率极低。该文库通过荧光激活细胞分选技术进行筛选,成功分离出具有蓝、绿、黄、红等不同荧光发射特征的变体,证明了其能够组装出高度多样且功能完整的分子文库。
![]()
图5 | Sidewinder组装具有高覆盖率的大型组合文库。 a. 通过将条形码寡核苷酸与含预定突变的编码寡核苷酸退火生成Sidewinder文库片段。 b. 荧光蛋白文库十片段组装示意图。 c. 文库组装PCR产物的DNA琼脂糖凝胶图,显示单一强目标条带。 d. 对克隆前Sidewinder文库的PacBio测序分析饼图。 e. 文库PacBio测序数据的连接点分析。 f. 用于组装的寡核苷酸(排除预定突变位点及其侧翼碱基)的每碱基准确性分布小提琴图与箱线图。 g. 密码子水平的突变多样性,显示克隆前实验分布与理论分布。 h. 基因水平的突变多样性,显示克隆前与克隆后测序读段分配到各可能突变组合的比例。 i. 所有可能突变组合的序列空间,以及克隆前、克隆后测序中出现的组合。 j. 克隆前与克隆后测序中观察到的所有变体比例相对关系图。 k. 考虑Sidewinder文库17个多样化位点中任意N个突变位点组合时所实现的多样性百分比。 l. 荧光面积与高度散点图,显示蓝、绿、黄、红荧光阳性群体。
综上所述,Sidewinder技术通过三向连接结构将序列信息与组装指令解耦,实现了真正独立于序列的DNA组装,能够构建以往难以实现的复杂、多样DNA序列。其组装能力仅受输入DNA质量和大小的限制,而不会引入额外错误。该技术为大规模并行组装、超复杂序列合成以及高覆盖率组合文库构建提供了强大工具,有望在合成基因组学、医学、农业、材料科学及AI辅助的生物设计等领域发挥重要作用,推动从计算机预测到物理分子快速、可扩展生成的连接。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.