网易首页 > 网易号 > 正文 申请入驻

谷歌再发顶刊Science:革命性人工智能工具,预测人类所有可能的致病突变

0
分享至

研究背景

2021年7月,谷歌旗下的DeepMind团队在Nature发表论文,发布了基于人工智能(AI)的蛋白质结构预测工具——AlphaFold2,AlphaFold2仅通过氨基酸序列就能以前所未有的准确度预测蛋白质三维结构。AlphaFold的出现,开启了计算生物学的新时代。

两年后的2023年9月,DeepMind团队在Science期刊发表论文。这一次,他们基于AlphaFold开发了一种新的革命性人工智能工具——AlphaMissense,用于寻找导致遗传疾病的基因突变。

AlphaMissense提供了一个预测所有可能的人类单氨基酸替代的数据库(包含19233个标准人类蛋白质的2.16亿种可能的单一氨基酸变化),预测到了7100万个错义突变,并将89%的错义变异分类为可能是良性的(57%)或可能是致病性的(32%)。

AlphaMissense对医生和人类遗传学家将非常有用,非常有希望能帮助他们查明遗传疾病的原因。

2023最火热门专题推荐

一、CRISPR-Cas9基因编辑技术

二、机器学习转录组与表观组技术

三、蛋白质晶体结构解析技术

四、机器学习代谢组学技术

五、AIDD人工智能药物发现与设计

六、单细胞空间转录组应用

七、CADD计算机辅助药物设计专题

八、深度学习基因组学专题

专题一、CRISPR-Cas9基因编辑技术

第一天

一. 基因编辑工具介绍

1. 基因编辑和转基因是一样的吗?

2. 生活中的基因编辑与转基因产品

3. 基因编辑工具先驱-ZFNs和TALENs

4. 没落的ZFNs和TALENs

5. TALENs,旧工具新用,细胞器编辑利器!

6. 强势崛起的CRISPR系统

7. CRISPR系统家族介绍

8. CRISPR-Cas9的工作原理

9. CRISPR-Cas12的工作原理

10. CRISPR系统的致命缺点

11. 如何选择合适的CRISPR系统?

第二至三天

二. CRISPR系统可以做什么?

1. 基因敲除/基因敲入

i. 基因修复途径介绍(NHEJ和HDR)

ii. Knock-in和Knock-out的简介

iii. Knock-in策略简介(HDR/Retron/双pegRNA策略/GRAND/TJ-PE)

2. 多敲系统简介

3. CRISPRa/CRISPRi(基因激活与基因抑制)

i. dCas9-PVPR系统介绍

ii. dCas9-VP64/GI/SAM基因激活系统介绍

iii. 基因编辑招募系统介绍(Suntag/Moontag)

4. CRISPR系统的‘另类’应用(循环打靶)

5. CBE系统的原理及其应用

i. CBE系统进化过程总结(CBEmax/每代优化的元件及策略汇总)

ii. 基因组CBE编辑(植物育种/基因功能研究/临床治疗)

iii. 细胞器CBE编辑工具介绍(Ddda脱氨酶/MutH切口酶)

iv. CBE系统的脱靶效应

6. ABE系统的原理及其应用

i. PACE和PANCE人工定向蛋白进化系统介绍及其他常规的蛋白进化技术

ii. ABE系统的进化过程总结(ABEmax/ABE8e每代优化的元件及策略汇总)

iii. ABE系统的‘另类’应用(基因失活/跳剪/介导C编辑)

iv. 双碱基编辑系统(SWISS/STEME/A&C-BEmax/SPACE/ACBE)

7. PE系统的原理及其应用

i. PE介导精准编辑

ii. 编辑效率的影响因素(骨架二级结构/PBS长度/RTT模板)

iii. 双pegRNA的原理及其应用(基因组大片段插入)

iv. 基因组大片段删除

v. 用于AAV递送的PE系统

8. gGBE的原理及其应用

i. 糖基化酶介绍(为什么可以介导碱基编辑?)

ii. gGBE的开发与应用

iii. gGBE的后续发展预测

9. CRISPR-Case12的病毒检测应用

i. 原理介绍

ii. 应用案例介绍

第四天

三. CRISPR载体构建(实操)

1. 敲除/碱基编辑载体构建

i. 工具介绍

ii. 如何查看质粒图谱

iii. 基因靶点的选择(CRISPR-GE等线上工具展示)

iv. sgRNA的引物设计

v. 模拟构建(酶切载体/构建体系讲解)

vi. 菌落PCR

vii. 测序鉴定结果分析

2. PE系统的载体构建

i. 引物设计工具的应用

ii. 载体构建演示

iii. 测序结果分析

3. 转染阳性检测

4. 测序原理及结果查看

i. 一代测序原理

ii. Hi-TOM高通量测序

第五天

四. 基因编辑在植物种的应用

1. 基因功能研究

2. 创制新品种

五. 基因编辑在临床上的应用

1. 碱基编辑的临床应用

2. PE系统的临床应用

3. 递送系统的介绍

六. 基因编辑在微生物中的应用

1. 微生物遗传学研究

2. 生物技术(可产生生物燃料/生物塑料/药物等有用的化合物)

七. 机器学习在基因编辑领域的应用

1. 基因编辑结果的预测

2. 编辑效率影响因素的探索

专题二、机器学习转录组学表观组学

第一天

理论部分

高通量测序原理

高通量测序基础

测序方法及数据

二代测序数据分析流程

实操内容

R语言基础

R(4.1.3)和Rstudio的安装

R包安装和环境搭建

数据结构和数据类型

R语言基本函数

数据下载

数据读入与输出

第二天

理论部分

多组学基础

常用生物组学实验与分析方法

常用组学数据库介绍

批量处理组学数据

生物功能分析

基于转录组学的差异基因筛选,疾病预测

组学数据可视化

实操内容

Linux操作系统

Linux操作系统的安装与设置

网络配置与服务进程管理

Linux的远程登录管理

常用的Linux命令

在Linux下获取基因数据

利用Linux探索基因组区域

Shell script与Vim编辑器

基因组文件下载与上传

Linux权限管理

文件的身份

修改文件的所有者和所属组

修改文件权限

第三天

理论部分

介绍转录组学的基本概念和研究流程

RNA-seq数据的预处理和质量控制

序列比对和对齐评估

基因表达量估计和差异表达分析

实操内容

转录组测序数据质量控制

转录组数据比对

RNA-seq数据原始定量

主成分分析

原始定量结果差异分析

差异结果筛选及可视化

GO和KEGG通路富集分析

GSEA基因集富集分析

第四天

理论部分

表观遗传学的基本概念和技术介绍

DNA甲基化和组蛋白修饰的分析方法

表观组数据的预处理和质量控制

差异甲基化和差异修饰分析

甲基化和修饰的功能注释和富集分析

甲基化数据的整合分析和基因调控网络构建

表观组数据的可视化方法和工具

介绍其他表观组学技术(如染色质构象捕获)

实操内容

测序数据质量控制和检查

数据比对和多匹配问题

计算结合峰位置

IGV中组学结果可视化

差异peaks分析

结合程度矩阵计算

富集热图和曲线图绘制

第五天

理论部分

机器学习概述

线性模型

决策树

支持向量机

集成学习

模型选择与性能优化

实操内容

决策树算法实现

随机森林算法实现

支持向量机(SVM)算法实现

朴素贝叶斯算法实现

Xgboost算法实现

聚类算法实现

DBSCAN算法实现

层次聚类算法实现

理论部分

基因功能注释和富集分析

WGCNA(Weighted Gene Co-expression Network Analysis)网络分析

转录因子分析和调控网络构建

转录组数据的可视化方法和工具

转录水平预测蛋白翻译水平

实操内容

创建Seurat对象

数据质控

测序深度差异及标准化

单细胞数据降维

批次效应去除

数据整合

亚群注释

GSVA通路活性分析

单细胞富集分析

专题三、蛋白质晶体解析

第一天

蛋白质结晶前准备

1. 目的蛋白质信息检索(包括实操演示)

1.1 不同种属的蛋白

1.2 蛋白质一级结构的调查

1.3 蛋白质三级结构的预测

1.4 蛋白质理化特性的预测

1.5 蛋白质的配体和共价修饰

2. 分子克隆技术

2.1 目的基因的获取(包括实操演示)

2.2 目的基因的引物设计(包括实操演示)

2.3 传统克隆技术(涉及学习SnapGene软件,包括实操演示)

2.4 无缝克隆技术(涉及学习SnapGene软件,包括实操演示)

以某一基因进行操作演示

3. 利用大肠杆菌表达目的蛋白

3.1 目的蛋白的小量鉴定表达

3.2 目的蛋白的大量表达

3.3 收菌和裂解菌体

3.4 裂解液的离心

3.5 目的蛋白的浓缩

3.6 目的蛋白浓度的测定

4. 真核表达系统

第二天

蛋白质结晶准备

1.蛋白晶体结构的特征

1.1蛋白晶体的空间格子、晶胞和晶面指标

1.2蛋白晶体的对称性、点群、晶系和空间群

2. 蛋白质晶体生长的理论知识(详细讲解温度、pH值、离子强度、有机溶剂、沉淀剂,等等,对蛋白晶体生长的影响;影响蛋白质晶型的因素)

3. 蛋白质晶体生长条件的初筛(详细讲解晶体初筛的注意事项)

4. 蛋白质晶体生长条件的优化 (详细讲解晶体优化的方法,包括改变pH值、沉淀剂,等因素)

5. 晶种法优化蛋白质晶体生长条件

6. 蛋白晶体的挑选和防冻液的配制

第三天

蛋白晶体衍射数据收集

1.X射线衍射

1.1. X射线衍射原理

1.2. X射线衍射的电子密度

1.3. 晶体结构解析的相角问题

2. 上海光源线站BL18U1、BL19U1和BL02U1收集数据的方法 (重点详细讲解,可能需要更长的时间)

3. 蛋白晶体结构解析软件的安装(包括Ubuntu系统、Phenix软件、CCP4软件、PyMoL软件、XDS软件和Adxv软件)

第四天

蛋白晶体结构解析

1. 晶体结构的解析

1.1. 晶体结构解析流程

1.2. Index、Intergrate和Scale

1.3. 分子置换技术(包括实操演示)

1.4. 蛋白晶体结构的重建(包括实操演示)

1.5. 蛋白晶体结构的优化(包括实操演示)

2. 晶体结构的精修(涉及COOT软件、Phenix软件和CCP4软件,包括实操演示)

3. 晶体结构质量的评价指标(详细讲解各个评价指标)

4. 蛋白质结构中加入小分子配体

5. 在结构解析过程中,如何利用软件提高分辨率(重点讲解,需要较长的时间)

第五天

蛋白晶体结构的提交及展示

1. 从晶体生长到解析,详细剖析提高分辨率的方法(包括示例演示)

2. 蛋白晶体结构数据提交到PDB(包括实操演示)

3. 蛋白晶体结构的展示(包括实操演示)

案例图片:

专题四、机器学习代谢组学

第一天

A1 代谢物及代谢组学的发展与应用

(1) 代谢生理功能;

(2) 代谢疾病;

(3) 非靶向与靶向代谢组学;

(4) 空间代谢组学与质谱成像(MSI);

(5) 代谢流与机制研究;

(6) 代谢组学与药物和生物标志物。

A2 代谢组学实验流程简介

A3 色谱、质谱硬件原理

(1) 色谱分析原理;

(2) 色谱的气相、液相和固相;

(3) 色谱仪和色谱柱的选择;

(4) 质谱分析原理及动画演示;

(5) 正、负离子电离模式;

(6) 色谱质谱联用技术;

(7) LC-MS 的液相系统

A4 代谢通路及代谢数据库

(1) 几种经典代谢通路简介;

(2) 能量代谢通路;

(3) 三大常见代谢物库:HMDB、METLIN 和 KEGG;

(4) 代谢组学原始数据库:Metabolomics Workbench 和Metabolights.

第二天

B1 代谢物样本处理与抽提

(1)组织、血液和体液样本的提取流程与注意事项;

(2)用 ACN 抽提代谢物的流程与注意事项;

(3)样本及代谢物的运输与保存问题;

B2 LC-MS数据质控与搜库

(1)LC-MS 实验过程中 QC 样本的设置方法;

(2)LC-MS 上机过程的数据质控监测和分析;

(3)XCMS 软件数据转换与提峰;

B3 R软件基础

(1)R 和 Rstudio 的安装;

(2)Rstudio 的界面配置;

(3)R 的基本数据结构和语法;

(4)下载与加载包;

(5)函数调用和 debug;

B4 ggplot2

(1)安装并使用 ggplot2

(2)ggplot2 的画图哲学;

(3)ggplot2 的配色系统;

(4)ggplot2 画组合图和火山图;

第三天

机器学习

C1无监督式机器学习在代谢组学数据处理中的应用

(1)大数据处理中的降维;

(2)PCA 分析作图;

(3)三种常见的聚类分析:K-means、层次分析与 SOM

(4)热图和 hcluster 图的 R 语言实现;

C2一组代谢组学数据的降维与聚类分析的 R 演练

(1)数据解析;

(2)演练与操作;

C3有监督式机器学习在代谢组学数据处理中的应用

(1)数据用 PCA 降维处理后仍然无法找到差异怎么办?

(2)PLS-DA 找出最可能影响差异的代谢物;

(3)VIP score 和 coef 的意义及选择;

(4)分类算法:支持向量机,随机森林

C4一组代谢组学数据的分类算法实现的 R 演练

(1)数据解读;

(2)演练与操作;

第四天

D1 代谢组学数据清洗与 R 语言进阶

(1)代谢组学中的 t、fold-change 和响应值;

(2)数据清洗流程;

(3)R 语言 tidyverse

(4)R 语言正则表达式;

(5)代谢组学数据过滤;

(6)代谢组学数据 Scaling 原理与 R 实现;

(7)代谢组学数据的 Normalization;

(8)代谢组学数据清洗演练;

D2在线代谢组分析网页 Metaboanalyst 操作

(1)用 R 将数据清洗成网页需要的格式;

(2)独立组、配对组和多组的数据格式问题;

(3)Metaboanalyst 的 pipeline 和注意事项;

(4)Metaboanalyst 的结果查看和导出;

(5)Metaboanalyst 的数据编辑;

(6)全流程演练与操作

第五天

E1机器学习与代谢组学顶刊解读(2-3 篇);

(1)Nature Communication 一篇代谢组学小鼠脑组织样本 database 类型的文献;

(2)Cell 一篇代谢组学患者血液样本的机器学习与疾病判断的文献;

(3)1-2 篇代谢组学与转录组学和蛋白组学结合的文献。

E2 文献数据分析部分复现(1 篇)

(1)文献深度解读;

(2)实操:从原始数据下载到图片复现;

(3) 学员实操。

案例图片:

专题五、AIDD人工智能药物发现

1.Day01-AIDD概述及药物综合数据库介绍

2.人工智能辅助药物设计AIDD概述

3.安装环境

(1)anaconda

(2)vscode

(3)pycharm

(4)虚拟环境

4.第三方库基本使用方法

(1)numpy

(2)pandas

(3)matplotlib

(4)requests

5.多种药物综合数据库的获取方式

(1)KEGG(requests爬虫)

(2)Chebi(libChEBIpy)

(3)PubChem(pubchempy / requests)

(4)ChEMBL(chembl_webresource_client)

(5)BiGG(curl)

(6)PDB(pypdb)

Day02 ML-based AIDD

1.机器学习

(1)机器学习种类:

①监督学习

②无监督学习

③强化学习

(2)典型机器学习方法

①决策树

②支持向量机

③朴素贝叶斯

④神经网络

⑤卷积神经网络

(3)模型的评估与验证

(4)分类评估:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算

(5)回归评估:平均绝对误差、均方差、R2分数、可释方差分数

(6)交叉验证

2.sklearn工具包基本使用

3.rdkit工具包的基本使用

4.化合物编码方式和化合物相似性理论知识

5.项目实战1:基于ADME和Ro5的分子筛选

6.项目实战2:基于化合物相似性的配体筛选

7.项目实战3:基于化合物相似性的分子聚类

8.项目实战4: 基于机器学习的生物活性预测

9.项目实战5:基于机器学习的分子毒性预测

Day03 GNN-based AIDD

1.图神经网络

(1)框架介绍: PyG,DGL,TorchDrug

(2)图神经网络消息传递机制

(3)图神经网络数据集设计

(4)图神经网络节点预测、图预测任务和边预测任务实战

2.论文精讲:DeepTox: Toxicity Prediction using Deep Learning

3.项目实战1:基于图神经网络的分子毒性预测

(1)SMILES分子数据集构建PyG图数据集

(2)基于GNN进行分子毒性预测

4.项目实战2:基于图神经网络的蛋白质-配体相互作用预测

(1)蛋白质分子图形化,构建PyG图数据集

(2)基于GIN进行网络搭建及相互作用预测

Day04 NLP-based AIDD

1.自然语言处理

(1)Encoder-Decoder模型

(2)循环神经网络 RNN

(3)Seq2seq

(4)Attention

(5)Transformer

2.项目实战1:基于自然语言的分子毒性预测

(1)SMILES分子数据集词向量表示方法

(2)基于NLP模型进行分子毒性预测

3.项目实战2:基于Transformer的有机化学反应产量预测 (Prediction of chemical reaction yields using deep learning)

4.论文精读及代码讲解:《Mapping the space of chemical reactions using attention-based neural networks》

Day05 分子生成与药物设计

1.分子生成模型

(1)循环神经网络RNN

(2)变分自动编码器VAE

(3)生成对抗网络GAN

(4)强化学习RL

2.项目实战1: 基于图数据的小分子化合物生成模型《A Graph to Graphs Framework for Retrosynthesis Prediction》

3.项目实战2: 基于NLP的抗体生成模型《Generative language modeling for antibody design》

案例图片:

视频课程、单细胞空间转录组专题

第一天

单细胞测序技术与应用

理论内容:

1.单细胞组学研究简介

2.单细胞转录组测序技术进展及其原理:1992\2009-至今

3.单细胞多组学和空间转录组技术简要介绍;

4.单细胞转录组测序技术的常见应用和重要的生物学问题的探索;

4.单细胞主要数据库介绍。

实操内容:

1. Linux命令入门讲解及实操训练。

2. R语言简介及安装。

3. R语言简单语法及常见命令。

4. 数据挖掘及其统计应用的原理。

5. R语言实操画图ggplot2为主简单实操。

第二天

单细胞转录组数据分析思路及流程以及数据分析实操

单细胞转录组数据分析思路及流程以及数据分析实操

理论内容:

1. 单细胞实验介绍,常见建库结构(以10*建库为例)。

2. 单细胞转录组Pipeline软件和代码介绍。

3. 单细胞转录组转录因子及其细胞通讯介绍。

4. 单细胞组学在肿瘤、发育、免疫及其它等领域的研究思路介绍。

实操内容:

1. 10X官方单细胞软件Cellranger讲解及实操;

2.质控基因和细胞;

3.选取高可变基因;

4.降维与分群;

5.Biomarker定义细胞类型;

6.寻找差异基因;

6. 通过Seurat 合并多样本及消除样本异质性;

7. 通过harmony合并多样本及其消除样本异质性。

第三天

单细胞转录组轨迹、通路、转录因子、hdWGCNA等分析及绘图实操

实操内容:

1. 通过Monocle软件对单细胞转录组进行拟时序的分析。

2. 对单细胞各个簇进行通路的功能富集分析。

3. 通过GSVA给细胞通路打分等。

4. 利用cellchart软件对细胞互作进行分析。

5. 讲解单细胞WGCNA,利用关联共表达找到某些细胞中有关联作用的基因list(也就是模块)。

6. 全面解析SCENIC软件进行转录因子预测分析。

理论内容:

1. 空间转录组技术的介绍。

2. 空间转录组技术的应用。

3. 空间转录组文章图表的解读。

5. 空间转录组技术在癌症、发育、神经科学等领域的研究思路。

第四天

1. 空间转录组数据比对、降维以及聚类等分析

2. 空间转录组多样本及与但单细胞数据关联分析

实操内容:

1. 10x Visium 组织优化及文库制备。

2. 10x Visium官方分析软件Space Ranger讲解及实操。

3. Space Ranger输出结果解读。

4. Loupe Browser软件安装及使用。

5. 通过Seurat软件进行降维、聚类和可视化。

6. 通过Seurat进行基因表达可视化。

理论+实操内容

1. 通过Seurat进行空间变量特征的识别。

2. 与单细胞数据关联分析(空间细胞类型定义)

3. 通过Seurat处理多个切片。

4. 单细胞及空间转录组数据分析总结。

视频课程、CADD计算机辅助药物设计

简介

CADD计算机辅助药物设计:依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。

学习目标:计算机辅助药物设计主要包含:PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、分子动力学等

分子对接:分子对接是通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计的方法。主要研究分子间(如配体和受体)相互作用,并预测其结合模式和亲合力的一种理论模拟方法.近年来,分子对接方法已成为计算机辅助药物研究领域的一项最火最重要的技术。

虚拟筛选:虚拟筛选(virtual screening,VS)也称计算机筛选,即在进行生物活性筛选之前,利用计算机上的分子对接软件模拟目标靶点与候选药物之间的相互作用,计算两者之间的亲和力大小,以降低实际筛选化合物数目,同时提高先导化合物发现效率。

分子动力学:分子动力学是一门结合物理,数学和化学的综合技术。分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。

近年来发过哪些顶刊以及方向:

计算机辅助药物设计|J. Med. Chem.|基于晶体结构的MPS1抑制剂的设计和优化

JCIM|DockIT:虚拟现实交互的柔性分子对接

Nature Methods | 蛋白质序列的深度嵌入和比对

Trends Biochem Sci|配体结合动力学计算方法研究进展

Curr Opin Struc Biol | 多目标药物设计中的人工智能

MDPI Processes | 分子动力学模拟在食品及其工艺中的应用

Food Chemistry | 分子对接和分子动力学模拟

目前计算机辅助药物设计受众人体众多,列如CADD、药物设计、药学、药物研发、药物筛选、新药研发、药物化学、生物制药、免疫、天然产物、兽药研发,生物信息、中药药理、中药化学、网络药理、结构药理、食品安全、食品风味、食药研发、食品研发、抗肿瘤药物、肿瘤免疫、酶工程、遗传、抗体药物、农业工程、化学、有机合成、有机化学、结构生物、合成生物等众多科研人员。

讲师介绍

计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,有十余年的研究经验。

课表内容

第一天上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1优势及主要功能介绍

3.2界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白

-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点

PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

5.核酸-小分子对接

5.1核酸-小分子的应用现状

5.2相关的程序介绍

5.3核酸-小分子的结合种类

5.4核酸-小分子对接

5.5相关结果的分析

以人端粒

g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶

2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白

(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

案例实操图片:

视频课程、深度学习基因组学

简介

深度学习基因组学:是一门涉及多个领域的交叉学科,其主要目标是利用深度学习技术来分析基因组数据,为生物医学研究提供有价值的信息和洞察。所涉及的领域主要有基因表达预测、基因变异检测、疾病预测与诊断、药物发现与设计、进化与系统发生学研究、基因组序列组装与注释、精准医疗与个性化治疗等方面。

基因序列分析:基因序列分析是基因组学的基础,它涉及到将DNA序列转化为有意义的信息。深度学习在这个过程中扮演了重要角色,可以帮助研究人员对序列进行比对、基因识别以及序列分析等。深度学习模型可以自动学习和识别基因序列中的模式,从而更准确、高效地分析基因序列数据。

基因表达预测:基因表达预测是预测基因在特定条件下的表达水平。深度学习可以通过分析基因表达谱数据,预测基因的表达量、转录因子等。此外,深度学习还可以预测细胞状态、疾病状态等,为进一步研究基因功能和疾病机制提供有力支持。

精准医疗:精准医疗是一种根据个体的基因组、表型和环境因素等信息,为其提供个性化医疗方案的医疗模式。深度学习可以帮助研究人员分析海量的基因组和临床数据,以发现疾病与基因组之间的关联,从而为精准医疗提供更精确的依据。此外,深度学习还可以帮助医生根据患者的基因组信息为其制定更合适的诊疗方案。

药物发现:药物发现是一个漫长而复杂的过程,涉及到靶点发现、化合物筛选等多个步骤。深度学习可以通过分析大量的生物数据,帮助研究人员寻找潜在的药物靶点,并预测化合物的活性。此外,深度学习还可以优化药物设计和制造过程,以降低成本和提高效率。

近年来发过哪些顶刊以及方向

Nature Reviews Genetics|深度学习-基因组学计算建模新技术

Mamoon Rashid|深度学习基因组学在测序数据中的应用

Science Advances|利用深度学习发现癌症中的新基因突变

Cancer Cell | 基于多模态深度学习的泛癌组织学-基因组学整合分析

Nature Reviews Cancer|癌症蛋白基因组学:当前影响和未来展望

目前深度学习基因组学受众人体众多,列如基因组学,生物信息学,生命科学,小麦遗传育种,临床药理学,中药药理学,口腔修复,肿瘤免疫,整形外科,脊椎畸形,中药新药开发,分子流行病,心血管疾病,皮肤病等众多科研人员。

讲师介绍

深度学习基因组学主讲老师刘老师,生物信息学博士,有十余年的测序数据分析经验。研究领域涉及人工智能、自然语言处理、功能基因组学、转录组学、miRNA及靶基因网络分析,单细胞测序数据分析,基因调控网络时序分析,蛋白质互作网络分析,多组学联合分析等。主持省自然科学基金等项目4项,出版医学实用教材《Python医学实战分析》,发表SCI论文22篇,其中一作及并列一作9篇。

课表内容

第一天

理论部分

深度学习算法介绍

1.有监督学习的神经网络算法

1.1全连接深度神经网络DNN在基因组学中的应用举例

1.2卷积神经网络CNN在基因组学中的应用举例

1.3循环神经网络RNN在基因组学中的应用举例

1.4图卷积神经网络GCN在基因组学中的应用举例

2.无监督的神经网络算法

2.1自动编码器AE在基因组学中的应用举例

2.2生成对抗网络GAN在基因组学中的应用举例

实操内容

1.Linux操作系统

1.1常用的Linux命令

1.2 Vim编辑器

1.3基因组数据文件管理, 修改文件权限

1.4查看探索基因组区域

2.Python语言基础

2.1.Python包安装和环境搭建

2.2.常见的数据结构和数据类型

第二天

理论部分

基因组学基础

1.基因组数据库

2.表观基因组

3.转录基因组

4.蛋白质组

5.功能基因组

实操内容

基因组常用深度学习框架

1.安装并介绍深度学习工具包tensorflow, keras,pytorch

2.在工具包中识别深度学习模型要素

2.1.数据表示

2.2.张量运算

2.3.神经网络中的“层”

2.4.由层构成的模型

2.5.损失函数与优化器

2.6.数据集分割

2.7.过拟合与欠拟合

3.基因组数据处理

3.1安装并使用keras_dna处理各种基因序列数据如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等

3.2使用keras_dna设计深度学习模型

3.3使用keras_dna分割训练集、测试集

3.4使用keras_dna选取特定染色体的基因序列等

4.深度神经网络DNN在识别基序特征中应用

4.1实现单层单过滤器DNN识别基序

4.2实现多层单过滤器DNN识别基序

4.3实现多层多过滤器DNN识别基序

第三天

理论部分

卷积神经网络CNN在基因调控预测中的应用

1.Chip-Seq中识别基序特征G4,如DeepG4

2.Chip-Seq中预测DNA甲基化,DeepSEA

3.Chip-Seq中预测转录调控因子结合,DeepSEA

4.DNase-seq中预测染色体亲和性,Basset

5.DNase-seq中预测基因表达eQTL,Enformer

实操内容

复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA,预测染色体亲和性Basset,基因表达eQTL

1.复现DeepG4从Chip-Seq中识别G4特征

2.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变

3.复现Basset,从Chip-Seq中预测染色体亲和性

4.复现Enformer,从Chip-Seq中预测基因表达eQTL

第四天

理论部分

深度学习在识别拷贝数变异DeepCNV、调控因子DeepFactor上的应用

1.SNP微阵列中预测拷贝数变异CNV,DeepCNV

2.RNA-Seq中预测premiRNA,dnnMiRPre

3.从蛋白序列中预测调控因子蛋白质,DeepFactor

实操内容

1.复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异

2.复现循环神经网络RNN工具 dnnMiRPre,从RNA-Seq中预测premiRNA

3.复现DeepFactor,从蛋白序列中识别转录调控因子蛋白质

第五天

理论部分

深度学习在识别及疾病表型及生物标志物上的应用

1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType

2.从高维多组学数据中识别疾病表型,XOmiVAE

3.基因序列及蛋白质相互作用网络中识别关键基因的深度学习工具DeepHE

实操内容

1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型

2.复现XOmiVAE,从TCGA多维数据库中识别乳腺癌亚型

3.复现DeepHE利用基因序列及蛋白质相互作用网络识别关键基因

第六天

理论部分

深度学习在预测药物反应机制上的应用

1.联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet

实操内容

1.预处理药物分子结构信息

2.计算药物相似性

3.在不同数据集上构建self-attention SWnet

4.评估self-attention SWnet

5.构建多任务的SWnet

6.构建单层SWnet

7.构建带权值层的SWnet

案例实操图片:

培训特色及福利

课程特色

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答

授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!

腾讯会议实时直播解答|手把手带着操作

学员对于培训给予高度评价

学员培训后投顶刊

授课时间及地点-腾讯会议直播

CRISPR-Cas9基因编辑

2023.11.25----2023.11.26全天授课(上午09.00-11.30下午13.30-17.00)

2023.11.29----2023.11.30晚上授课(晚上19.30-22.00)

2023.12.02----2023.12.03全天授课(上午09.00-11.30下午13.30-17.00)

机器学习转录组学与表观组学

2023.11.25----2023.11.26全天授课(上午09.00-11.30下午13.30-17.00)

2023.11.29----2023.11.30晚上授课(晚上19.30-22.00)

2023.12.02----2023.12.03全天授课(上午09.00-11.30下午13.30-17.00)

机器学习代谢组学

2023.11.25----2023.11.26全天授课(上午09.00-11.30下午13.30-17.00)

2023.11.29----2023.11.30晚上授课(晚上19.30-22.00)

2023.12.02----2023.12.03全天授课(上午09.00-11.30下午13.30-17.00)

蛋白质晶体结构解析

2023.11.25----2023.11.26全天授课(上午09.00-11.30下午13.30-17.00)

2023.11.29----2023.11.30晚上授课(晚上19.00-22.00)

2023.12.02----2023.12.03全天授课(上午09.00-11.30下午13.30-17.00)

AIDD人工智能药物发现

2023.11.25----2023.11.26全天授课(上午09.00-11.30下午13.30-17.00)

2023.11.28----2023.11.29晚上授课(晚上19.00-22.00)

2023.12.02----2023.11.03全天授课(上午09.00-11.30下午13.30-17.00)

提供全程的回放视频二次学习也是免费的

培训费用

课程报名费用:

公费价:每人每班¥5880元 (含报名费、培训费、资料费、提供课后全程回放资料)

自费价:每人每班¥5480元 (含报名费、培训费、资料费、提供课后全程回放资料)

重磅优惠:

报二送一(同时报名两个班免费赠送一个学习名额赠送班任选)

报四送二(同时报名四个班免费赠送两个学习名额赠送班任选)

优惠1:两班同报:9880元

三班同报:13880元

四班同报:17680元

五班同报:21680元

六班同报:24680元

七班同报:26680元(可免费学习一整年)

特惠:(28880元可免费学习两整年本单位举办的任意课程)

优惠2:提前报名缴费可享受300元优惠(仅限十五名)

证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)

报名学习课程可赠送往期课程回放(可点击跳转详情链接):

回放一:

回放二:

回放三:

回放四:

回放五:

回放六:等视频回放,需要可咨询下方联系老师

报名咨询方式

微信:766728764

电话:15238680799

引用本次参会学员的一句话:

发现真的是脚踏实地的同时 需要偶尔仰望星空非常感谢各位对我们培训的认可!祝愿各位心想事成

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄乌战争进入了倒计时,胜负从开战当天就决定了

俄乌战争进入了倒计时,胜负从开战当天就决定了

涛哥锐评
2024-05-07 12:26:21
笑不活了,中俄免签的第一批受害者出现了,要被评论区笑死了

笑不活了,中俄免签的第一批受害者出现了,要被评论区笑死了

奇特短尾矮袋鼠
2024-06-07 15:54:13
兄弟姐妹中,最“命苦”的通常是老几?太准了,90%的家庭都一样

兄弟姐妹中,最“命苦”的通常是老几?太准了,90%的家庭都一样

第一心理
2024-06-15 19:57:11
欧倩怡首回应离婚,每天买菜送娃惨过佣人,单身后和6名男士约会

欧倩怡首回应离婚,每天买菜送娃惨过佣人,单身后和6名男士约会

开开森森
2024-06-15 07:58:01
当普通人都感觉经济很难的时候,其实经济危机早就全面爆发了

当普通人都感觉经济很难的时候,其实经济危机早就全面爆发了

芯怡飞
2024-06-01 14:19:03
女排3比2逆转土耳其 球员评分:5人满分,1人良好,4人及格

女排3比2逆转土耳其 球员评分:5人满分,1人良好,4人及格

篮球资讯达人
2024-06-16 00:29:11
他刚当市长就被老百姓指责,后来官至政治局常委,如今已经86岁了

他刚当市长就被老百姓指责,后来官至政治局常委,如今已经86岁了

李姐历史
2024-06-14 09:57:42
绝美身材,意味无穷

绝美身材,意味无穷

阿芒娱乐说
2024-06-03 21:35:12
大瓜!黄一鸣再曝猛料:不只生一个孩子,称生孩子王思聪都知道

大瓜!黄一鸣再曝猛料:不只生一个孩子,称生孩子王思聪都知道

娱记掌门
2024-06-14 18:50:25
巴萨9000万欧天才&“梅西接班人”震惊世界,打破欧洲杯64年纪录

巴萨9000万欧天才&“梅西接班人”震惊世界,打破欧洲杯64年纪录

侧身凌空斩
2024-06-16 00:06:01
很严重了,我劝大家极限存钱吧,从现在开始!

很严重了,我劝大家极限存钱吧,从现在开始!

大忘路
2024-06-12 07:32:37
李玟雕像在武汉揭幕,银光闪闪美如天使,86岁母亲戴黑手套现身

李玟雕像在武汉揭幕,银光闪闪美如天使,86岁母亲戴黑手套现身

开开森森
2024-06-15 17:49:41
普京直言:现在地球上真正算独立自主的国家只有5个,没有美国!

普京直言:现在地球上真正算独立自主的国家只有5个,没有美国!

星辰故事屋
2024-06-14 19:01:05
队长风范!阿根廷大胜后,梅西社媒晒球员合照:团结一致!

队长风范!阿根廷大胜后,梅西社媒晒球员合照:团结一致!

直播吧
2024-06-15 11:12:17
大s后悔了吗?具俊晔马尼拉酒吧商演放“流星雨”无人问津!

大s后悔了吗?具俊晔马尼拉酒吧商演放“流星雨”无人问津!

综艺拼盘汇
2024-06-16 01:06:07
18强赛最大变数诞生!力压沙特进二档,有望时隔40年再进世界杯!

18强赛最大变数诞生!力压沙特进二档,有望时隔40年再进世界杯!

绿茵舞着
2024-06-16 02:51:31
蔡斌扩大轮换获奇效!三将提升一传、防守、发球,助力后三局逆转

蔡斌扩大轮换获奇效!三将提升一传、防守、发球,助力后三局逆转

篮球资讯达人
2024-06-16 01:30:46
6艘巨舰南下,鹰击-21随时发射!最后大限前一夜,美航母掉头跑路

6艘巨舰南下,鹰击-21随时发射!最后大限前一夜,美航母掉头跑路

鹅毛的大雪
2024-06-15 13:52:36
西方急了!外媒:中国不能将月球据为己有,因为月球是全人类的!

西方急了!外媒:中国不能将月球据为己有,因为月球是全人类的!

趣说世界哈
2024-06-14 07:20:28
2024最建议买的5款SUV,很耐用开不坏,其它的请慎买

2024最建议买的5款SUV,很耐用开不坏,其它的请慎买

鸭梨说车
2024-06-15 16:45:52
2024-06-16 04:46:44
生物世界
生物世界
最前沿、最有趣的生命科学研究
6059文章数 144167关注度
往期回顾 全部

科技要闻

TikTok开始找退路了?

头条要闻

欧洲杯-亚马尔创纪录卡瓦哈尔首球 西班牙3-0克罗地亚

头条要闻

欧洲杯-亚马尔创纪录卡瓦哈尔首球 西班牙3-0克罗地亚

体育要闻

莱夫利,让困难为我让路

娱乐要闻

江宏杰秀儿女刺青,不怕刺激福原爱?

财经要闻

新情况!高层对人民币的态度180°转弯

汽车要闻

东风奕派eπ008售21.66万元 冰箱彩电都配齐

态度原创

时尚
健康
房产
旅游
本地

艳压四方的刘亦菲,也没能赢她

晚餐不吃or吃七分饱,哪种更减肥?

房产要闻

万华对面!海口今年首宗超百亩宅地,重磅挂出!

旅游要闻

如何文艺消夏?乌镇10大活动开启古镇消夏节

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

无障碍浏览 进入关怀版