网易首页 > 网易号 > 正文 申请入驻

Nature|华人‘‘智囊团’’最新研究成果将攻克有机化学领域重大科学难题!

0
分享至

通过用AI对最近100天Nature上化学领域相关的论文进行分析,我们可以看到化学领域在 2024 年展现出以下几个主要研究趋势:


  1. 基因组学和多组学:

  • 高通量测序技术的进步: 测序技术的发展使得对大量样本进行全基因组测序成为可能,如 All of Us Research Program 已经完成了 245,388 个临床级基因组测序,为研究人员提供了宝贵的资源。

  • 多组学研究: 研究人员开始将基因组学、转录组学、蛋白质组学等多种组学数据整合起来,以更全面地理解生物学过程和疾病机制。例如,研究人员使用单细胞多组学技术来研究衰老的人脑,并揭示了多种皮质细胞类型和状态。

  • 群体遗传学: 大规模古代基因组数据分析揭示了人类历史上的人口迁移和自然选择过程,例如研究人员发现多发性硬化症的遗传风险在草原游牧民族中出现,并通过 Yamnaya 相关的人口迁移大约在 5000 年前传入欧洲。

免疫学和疾病研究:

  • 癌症免疫治疗: 研究人员正在开发新的免疫治疗方法,例如针对 TRBC1 的抗体药物偶联物可以杀死 TRBC1+ 癌细胞,并治愈小鼠模型中的 T 细胞癌症。

  • 细胞治疗: 研究人员正在探索利用细胞疗法来治疗癌症和其他疾病,例如 ID3 基因可以赋予巨噬细胞强大的抗肿瘤活性,这为癌症的细胞治疗提供了新的思路。

  • 自身免疫性疾病: 研究人员正在研究自身免疫性疾病的机制,例如,研究发现 B 细胞在 neuromyelitis optica 中的免疫耐受中发挥关键作用。

  • 传染病: 研究人员正在开发新的抗生素来对抗耐药菌,例如针对脂多糖转运蛋白的新型抗生素 zosurabalpin 可以有效治疗高度耐药的 CRAB 菌株。

  • 神经退行性疾病: 研究人员正在使用人类细胞模型来研究神经退行性疾病的机制,例如 iCoMoNSCs 和 iNets 系统揭示了 TDP-43 蛋白病理和 NPTX2 积累之间的直接联系,为治疗神经退行性疾病提供了新的策略。

人工智能和计算生物学:

  • 机器学习: 机器学习方法被用于分析生物数据并预测蛋白质结构和功能,例如 ModelAngelo 可以自动构建冷冻电镜图中的原子模型,并识别未知序列的蛋白质。

  • 计算生物学: 计算生物学方法被用于模拟和分析生物学过程,例如,研究人员使用计算机模型来研究蛋白质结构和功能,以及模拟生物学过程,如 DNA 复制。

  • 大语言模型: 大语言模型正在被用于化学研究,例如 Coscientist 可以自主设计、计划和执行复杂的实验,并展示了加速研究的潜力。

01、CADD计算机辅助药物设计

目标:掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分 子动力学全程实操、溶剂化分子动力学模拟

02、AIDD人工智能药物发现与设计

目标:本课程让学员了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力

03、蛋白晶体结构解析深度学习基因组学

目标:让学员了解蛋白质晶体结构解析的原理、方法与技术,学习分子克隆、蛋白表达纯化、蛋白结晶方法、软件安装,蛋白结构数据处理,得到高分辨率的蛋白晶体结构。使学员通过本次课程的学习,很轻松地解析出蛋白晶体结构,并进行晶体结构的精修。

04、单细胞测序及空间多组学

目标:本课程聚焦单细胞测序技术, 以 10x 为例,通过讲解单细胞测序技术原理及应⽤,单细胞测序技术的产⽣,数据的质控,分析。通过实例分析深⼊学习基本⽣物信息分析的基本⼯具,常规⽣物信息领域的数据格式解读与分析,单细胞测序数据的分析与出图。经过本课程学习,学员将有能⼒独⽴任何类型的单细胞数据。并将结果应⽤于相应的学术⽂章的发表以及指导实际临床研究。

05、CRISPR-Cas9基因编辑技术

目标:课程从全局出发,由浅入深,课程通过基础入门+应用案例实操演练的方式,从最初的原理讲解到最后的应用实战,学完本课程你将掌握基因编辑技术的相关原理及其应用,此外可以学到基因编辑系统的优化策略,可以学到如何操作常用的生物学软件。能够快速运用到自己的科研项目和课题上。

06、机器学习微生物组学

目标:通过本次培训多个案例的系统讲解让参会学员学会机器学习在微生物组数据分析流程,能够快速运用到自己的科研项目和课题上。

07、机器学习代谢组学

目标:熟悉代谢组学和机器学习相关硬件和软件;熟悉代谢组学从样本处理到数据分析的全流程;能复现至少1篇CNS或子刊级别的代谢组学文章图片。

08、深度学习基因组学

目标:深入学习与了解深度学习基本框架与逻辑,同时掌握基本的生物信息学软件(Linux、R、python等)的使用,让学员能更好的应对基因组数据,挖掘出超越已有知识的新知识。而构建好的深度学习模型去探求新的研究思路和寻找新的潜在生物学机制,更好的服务于自身的科学研究和探索的过程中。

以下为内容介绍

WORK OVERVIEW

NO.1

CADD计算机辅助药物设计

内容可向下滑动

第一天

1 人工智能药物发现(AIDD)简介

2 机器学习和深度学习在药物发现领域的应用

2.1 分子属性预测与优化

2.2 虚拟筛选

2.3 药物副作用预测与安全性评估

2.4 新药分子设计

3 工具介绍与安装

3.1 Anaconda3/Pycharm 安装

3.2 Numpy 基础

3.3 Pandas 基础

3.4 Matplotlib 基础

3.5 Scikit-learn 基础

3.6 Pytorch 基础

3.7 RDKit 基础

第二天

1 机器学习简介

1.1 机器学习四要素

1.2 数据模块

1.3 核心和高级 API

2 回归算法与应用

2.1 线性回归

2.2 Lasso 回归

2.3 Ridge 回归

2.4 ElasticNset 弹性网络

3 分类算法与应用

3.1 逻辑回归

3.2 朴素贝叶斯

3.3 KNN

3.4 SVC

3.5 决策树

3.6 随机森林

3.7 集成学习

4 聚类算法

4.1 KMeans

4.2 密度聚类 DBSCAN

5 降维

5.1 奇异值分解 SVD

5.2 主成分分析 PCA

5.3 非负矩阵分解 NMF

6 模型的评估方法和评价指标

6.1 超参数优化

6.2 交叉验证

6.3 评价指标

7 特征工程

8 机器学习药物发现案例(一)

——化合物生物活性分类模型

9 机器学习药物发现案例(二)

——化合物生物活性回归模型

10 机器学习药物发现案例(三)

—— 药物副作用预测模型


图1. 副作用在药物-药物相似性网络中传播。

第三天

1 深度学习与药物发现( 一)

1.1 深度神经网络

1.2 正向和反向传播

1.3 优化方法

1.3.1 梯度下降增加动力

1.3.2 自适应学习

1.3.3 Adam

1.4 损失函数

1.4.1 平均绝对误差

1.4.2 均方误差损失函数

1.4.3 交叉熵损失函数

1.5 卷积神经网络

1.5.1 卷积层

1.5.2 填充和步幅

1.5.3 池化层

1.5.4 LeNet 网络

1.5.5 AlexNet 网络

2 深度学习药物发现案例(一)

—— 药物-药物相互作用预测模型


图 2. 利用药物关联网络特征和深度神经网络识别药物之间潜在相互作用事件。

第四天

1 深度学习与药物发现( 二)

1.1 循环神经网络

1.2 消息传递神经网络

1.3 图卷积神经网络

1.4 图注意力神经网络

1.5 图采样和聚合

2 深度学习药物发现案例(二)

—— 药物靶标相互作用预测模型

3 深度学习药物发现案例(三)

—— 药物重定位模型


第五天

1 深度学习与药物发现 (三)

1.1 注意力机制

1.2 自注意力模型

1.3 多头自注意力模型

1.4 交叉注意力模型

1.5 Transformer 模型

2 深度学习药物发现案例(四)

—— 药物-药物相互作用预测模型

3 深度学习药物发现案例(五)

—— 药物靶标结合亲和力预测模型


图 4.将药物和蛋白质信息关联起来的带有注意力区块的AttentionDTA模型

内容可向下滑动

第⼀天

⽣信基础培训 basics of bioinforma,c

• 什么是单细胞测序技术(以 10X 为例 )?单细胞测序技术的应⽤。

• Command line 基础知识,什么是 command line?

• Command line 的基本语法

• Shell scripts

• 如何在 HPC (high performance cluster)上提交作业

第⼆天

R 基础知识与单细胞数据分析⼯具的准备

• R and RStudio 的安装

• 常⽤ R 包的安装

• 单细胞相关的 R 和 RStudio 环境准备,及相应包的安装

• Seurat, ggplot2 等常⽤包的语法介绍


第三天

单细胞基础理论知识与质控分析

• 单细胞实验设计

• 单细胞数据产⽣

• Cellranger 的使⽤以及结果⽂件的解析

• 单细胞数据的读写,质量图谱解析

• 单细胞数据质控参数的选择与质控分析

• 质控后单细胞数据质量图谱展示及结果分析


第四天

单细胞数据下游分析 I

• 单细胞数据标准化过程以及降维分析

• 单细胞数据的 ScMransforma5on 分析

• 标准化后的单细胞数据的聚类分析

• Doublet 检测

• 细胞注释


第五天

单细胞数据下游分析 II

• 样品间的基因表达差异分析

• 富集分析

• Marker genes 识别

• 不同批次数据的整合分析

• 实际案例解析

• 其他下游数据分析 (依时间⽽定)


NO.2

机器学习代谢组学

内容可向下滑动

第一天

A1 代谢物及代谢组学的发展与应用

(1) 代谢与生理过程;

(2) 代谢与疾病;

(3) 非靶向与靶向代谢组学;

(4) 空间代谢组学与质谱成像(MSI);

(5) 代谢组学与药物和生物标志物;

(6) 代谢流与机制研究。

A2 代谢通路及代谢数据库

(1) 几种经典代谢通路简介;

(2) 三大常见代谢物库:HMDB、METLIN 和 KEGG;

(3) 代谢组学原始数据库:Metabolomics Workbench 和 Metabolights.

A3 参考资料推荐

A4 代谢组学实验流程简介

A5 色谱、质谱硬件与原理解析

(1) 色谱分析原理与构造;

(2) 色谱仪和色谱柱的选择;

(3) 色谱的流动相:梯度洗脱法;

(4) 离子源、质量分析器与质量检测器解析;

(5) 质谱分析原理及动画演示;

(6) 色谱质谱联用技术(LC-MS);

第二天

B1 代谢物样本处理与抽提

(1) 各种组织、血液和体液等样本的提取流程与注意事项;

(2) 代谢物抽提流程与注意事项;

(3) 样本及代谢物的运输与保存问题;

B2 LC-MS 数据质控与搜库

(1) LC-MS 实验过程中 QC 和 Blank 样本的设置方法;

(2) LC-MS 上机过程的数据质控监测和分析;

(3) 代谢组学上游分析原理——基于 Compound Discoverer 与 Xcms 软件;

(4) Xcms 软件数据转换、提峰、峰对齐与搜库;

B3 R 软件基础

(1) R 和 Rstudio 的安装;

(2) Rstudio 的界面配置;

(3) R 中的基础运算和统计计算;

(4) R 中的包:包,函数与参数的使用;

(5) R 语言语法,数据类型与数据结构;

(6) R 基础画图;

B4 ggplot2

(1) ggplot2 简介

(2) ggplot2 的画图哲学;

(3) ggplot2 的配色系统;

(4) ggplot2 数据挖掘与作图实战;

第三天

机器学习

C1 有监督式机器学习在代谢组学数据处理中的应用

(1) 人工智能、机器学习、深度学习的关系;

(2) 回归算法:从线性回归、Logistic 回归与 Cox 回归讲起;

(3) PLS-DA 算法:PCA 降维后没有差异的数据还有救吗?

(4) VIP score 的意义及选择;

(5) 分类算法:决策树,随机森林和贝叶斯网络模型;

C2 一组代谢组学数据的分类算法实现的 R 演练

(1) 数据解读;

(2) 演练与操作;

C3 无监督式机器学习在代谢组学数据处理中的应用

(1) 大数据处理中的降维;

(2) PCA 分析作图;

(3) 三种常见的聚类分析:K-means、层次分析与 SOM

(4) 热图和 hcluster 图的 R 语言实现;

C4 一组代谢组学数据的降维与聚类分析的 R 演练

(1) 数据解析;

(2) 演练与操作;

第四天

D1 在线代谢组分析网页 Metaboanalyst 操作

(1) 用 R 将数据清洗成网页需要的格式;

(2) 独立组、配对组和多组的数据格式问题;

(3) Metaboanalyst 中的上游分析(原始数据峰提取、峰对齐与搜库) (4) Metaboanalyst 的 pipeline 以及参数设置和注意事项;

(5) Metaboanalyst 的结果查看和导出;

(6) Metaboanalyst 的数据编辑;

(7) 全流程演练与操作。

D2 代谢组学数据清洗与 R 语言进阶

(1) 代谢组学中的 t、fold-change 和响应值;

(2) 数据清洗流程;

(3) R 语言 tidyverse;

(4) 数据预处理:数据过滤与数据标准化(样本的 Normalization 和代谢物的 Scaling);

(5) 代谢组学数据清洗演练;

第五天

E1 文献数据分析部分复现(1 篇)

(1) 文献深度解读;

(2) 实操:从原始数据下载到图片复现;

(3) 学员实操。

E2 机器学习与代谢组学顶刊解读(3 篇);

(1) Signal Transduction and Targeted Therapy 一篇有关饥饿对不同脑区代谢组学影响变 化的小鼠脑组织代谢图谱类的文献;(数据库型)

(2) Cell 一篇代谢组学孕妇全程血液代谢组学分析得出对孕周和孕产期预测的代谢标志物 的文献;(生物标志物型)

(3) Nature 一篇对胰腺癌患者肠道菌群的代谢组学分析找到可以提高化疗效果的代谢物的 文献。(机制研究型)

部分模型案例图片


NO.3

深度学习基因组学

内容可向下滑动

第一天

理论部分

深度学习算法介绍

1.有监督学习的神经网络算法

1.1全连接深度神经网络DNN在基因组学中的应用举例

1.2卷积神经网络CNN在基因组学中的应用举例

1.3循环神经网络RNN在基因组学中的应用举例

1.4图卷积神经网络GCN在基因组学中的应用举例

2.无监督的神经网络算法

2.1自动编码器AE在基因组学中的应用举例

2.2生成对抗网络GAN在基因组学中的应用举例

实操内容

1.Linux操作系统

1.1常用的Linux命令

1.2 Vim编辑器

1.3基因组数据文件管理, 修改文件权限

1.4查看探索基因组区域

2.Python语言基础

2.1.Python包安装和环境搭建

2.2.常见的数据结构和数据类型

第二天

基因组学基础

1. 基因组数据库

2. 表观基因组

3. 转录基因组

4.蛋白质组

5. 功能基因组

实操内容

基因组常用深度学习框架

1. 安装并介绍深度学习工具包tensorflow, keras,pytorch

2. 在工具包中识别深度学习模型要素

2.1.数据表示

2.2.张量运算

2.3.神经网络中的“层”

2.4.由层构成的模型

2.5.损失函数与优化器

2.6.数据集分割

2.7.过拟合与欠拟合

3.基因组数据处理

3.1安装并使用keras_dna处理各种基因序列数据如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等

3.2使用keras_dna设计深度学习模型

3.3使用keras_dna分割训练集、测试集

3.4使用keras_dna选取特定染色体的基因序列等

第三天

微生物组常用分析方法(实操)

1. 微生物丰度分析

2. 转录组丰度分析

3. 进化树分析

4. 降维分析

第四天

理论部分

深度学习在识别拷贝数变异DeepCNV

1. SNP微阵列中预测拷贝数变异CNV,DeepCNV

2. RNA-Seq中预测premiRNA,dnnMiRPre

实操内容

1. 复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异

复现循环神经网络RNN工具 dnnMiRPre,从RNA-Seq中预测premiRNA

第五天

理论部分

深度学习在识别及疾病表型及生物标志物上的应用

1. 从基因表达数据中识别乳腺癌分型的深度学习工具DeepType

实操内容

1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型

第六天

理论部分

深度学习在预测药物反应机制上的应用

1. 联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet

实操内容

1. 预处理药物分子结构信息

2. 计算药物相似性

3. 在不同数据集上构建self-attention SWnet

4. 评估self-attention SWnet

5. 构建多任务的SWnet

6. 构建单层SWnet

7. 构建带权值层的SWnet

部分模型案例图片



NO.4

机器学习微生物组学

内容可向下滑动

第一天

1.微生物学基础知识回顾

2.机器学习基本概念介绍

a.什么是机器学习

b.监督学习、无监督学习

c.常用机器学习模型介绍

3.混淆矩阵

4.ROC曲线

第二天

R语言简介与实操

1. R语言概述

2. R studio软件与R包安装

3. R语言语法及数据类型

4. 条件语句和循环

Linux实操

1. Linux操作系统

2. Linux操作系统的安装与设置

3. 网络配置与服务进程管理

4. Linux的远程登录管理

5. 常用的Linux命令

6. 在Linux下获取基因数据

7. Shell script与Vim编辑器下·

第三天

微生物组常用分析方法(实操)

1. 微生物丰度分析

2. 转录组丰度分析

3. 进化树分析

4. 降维分析

第四天

机器学习在微生物组学中的应用案例分享

1. 疾病预测应用:利用机器学习基于微生物组学数据预测疾病状态

2. 肠道菌群研究:机器学习研究饮食对肠道微生物的影响

第五天

机器学习模型训练和分析(实操)

1. 加载数据及数据归一化

2. 构建训练模型(GLM, RF, SVM)

3. 模型参数优化

4. 模型错误率曲线绘制

5. 混淆矩阵计算

6. 重要特征筛选

7. 模型验证,ROC曲线绘制利用模型进行预测

利用机器学习基于微生物组学数据预测宿主表型

1. 加载数据

2. 数据归一化

3. OUT特征处理

4. 机器学习模型构建(RF, KNN, SVM, Lasso等多种机器学习方法)

5. 绘制ROC 曲线,比较不同机器学习模型模型性能评估

利用机器学习基于临床特征和肠道菌群预测疾病风险

1. 加载数据

2. 机器学习模型构建(RF, gbm, SVM等等)

3. 交叉验证

4.模型性能评估

部分模型案例图片



NO.5

CRISPR-Cas9基因编辑技术

内容可向下滑动

第一天

基因编辑简介

1.基因编辑基本概念介绍

2.使用单基因遗传病数据库 (实操)

3. 5524种单基因遗传病的发病率及对应基因

4.使用网站查找突变位点周围碱基 选择基因编辑工具(实操)

5.基因编辑历史

6.TALEN

7.Zinc finger

8.Base editor

9.Prime editor

第二天

1.如何选择正确Cas9蛋白类型

2.单碱基编辑(base editor) gRNA设计和软件(实操)

3.sgRNA修饰

4.手动设计PegRNA的八个要点(实操)

5.七种PegRNA辅助设计软件

6. 查找不同PAM的Cas9的碱基序列

7. 设计Cas9 mRNA及其体外转录所需的DNA

8. 如何设计深度测序(NSG)所需的引物

9. 如何准备深度测序(NGS)所需样品

10. Sleeping beauty

11. PiggyBac

12. 肽核酸Peptide nucleic acids

13. 外显子跳读Exon skipping

14. 介绍CRISPR knock out库 (GeCKO v2.0)

15. 简单介绍Base editing在微生物中的应用


第三天

1.AAV递送(组织靶向)

2.脂质体递送

3.核糖核蛋白递送

4.高分子递送

5.Viral like particles递送

6.外泌体递送

7.无机纳米粒递送

8. 电转

9. 超声

10. 显微注射

11. PAM高通量筛选的6篇文章

12. Cas9-DNA-gRNA晶体结构

13.单基因遗传病细胞订制

14.单基因遗传病动物模型定制


第四天

1.动物模型

2.质粒

3.分子克隆基础

4.AAV设计(实操)

5.Base editing文章分析

6.Prime editing 相关的140篇文章概览

7.如何提高Prime editing效率

8.Prime editing 相关的87篇研究文章概览

9.如何提高Prime editing效率

10.NGS引物设计

11.NGS测序结果分析


第五天

1.基因编辑已经批准的药物

2. 临床试验

3.主要公司、科学家和专利

4.副作用和退市的产品

5.FDA政策

6.CRISPR在诊断中的应用

7.CRISPR library

8.CRISPR与单细胞测序

9. CRISPR与表观遗传学

10. CIRPSR在植物学中的应用

11. CRISPR在微生物学中的应用

12. NGS类型及原理

13. 3个基因序列的数据库(涵植物基因)

14. 2023年BE和PE领域热点

15. 设计课题与评价(实操)

NO.6

单细胞测序及空间多组学

内容可向下滑动

第⼀天

⽣信基础培训 basics of bioinforma,c

• 什么是单细胞测序技术(以 10X 为例 )?单细胞测序技术的应⽤。

• Command line 基础知识,什么是 command line?

• Command line 的基本语法

• Shell scripts

• 如何在 HPC (high performance cluster)上提交作业

第⼆天

R 基础知识与单细胞数据分析⼯具的准备

• R and RStudio 的安装

• 常⽤ R 包的安装

• 单细胞相关的 R 和 RStudio 环境准备,及相应包的安装

• Seurat, ggplot2 等常⽤包的语法介绍


第三天

单细胞基础理论知识与质控分析

• 单细胞实验设计

• 单细胞数据产⽣

• Cellranger 的使⽤以及结果⽂件的解析

• 单细胞数据的读写,质量图谱解析

• 单细胞数据质控参数的选择与质控分析

• 质控后单细胞数据质量图谱展示及结果分析


第四天

单细胞数据下游分析 I

• 单细胞数据标准化过程以及降维分析

• 单细胞数据的 ScMransforma5on 分析

• 标准化后的单细胞数据的聚类分析

• Doublet 检测

• 细胞注释


第五天

单细胞数据下游分析 II

• 样品间的基因表达差异分析

• 富集分析

• Marker genes 识别

• 不同批次数据的整合分析

• 实际案例解析

• 其他下游数据分析 (依时间⽽定)


NO.7

AIDD人工智能药物发现与设计

内容可向下滑动

第一天

1 人工智能药物发现(AIDD)简介

2 机器学习和深度学习在药物发现领域的应用

2.1 分子属性预测与优化

2.2 虚拟筛选

2.3 药物副作用预测与安全性评估

2.4 新药分子设计

3 工具介绍与安装

3.1 Anaconda3/Pycharm 安装

3.2 Numpy 基础

3.3 Pandas 基础

3.4 Matplotlib 基础

3.5 Scikit-learn 基础

3.6 Pytorch 基础

3.7 RDKit 基础

第二天

1 机器学习简介

1.1 机器学习四要素

1.2 数据模块

1.3 核心和高级 API

2 回归算法与应用

2.1 线性回归

2.2 Lasso 回归

2.3 Ridge 回归

2.4 ElasticNset 弹性网络

3 分类算法与应用

3.1 逻辑回归

3.2 朴素贝叶斯

3.3 KNN

3.4 SVC

3.5 决策树

3.6 随机森林

3.7 集成学习

4 聚类算法

4.1 KMeans

4.2 密度聚类 DBSCAN

5 降维

5.1 奇异值分解 SVD

5.2 主成分分析 PCA

5.3 非负矩阵分解 NMF

6 模型的评估方法和评价指标

6.1 超参数优化

6.2 交叉验证

6.3 评价指标

7 特征工程

8 机器学习药物发现案例(一)

——化合物生物活性分类模型

9 机器学习药物发现案例(二)

——化合物生物活性回归模型

10 机器学习药物发现案例(三)

—— 药物副作用预测模型


图1. 副作用在药物-药物相似性网络中传播。

第三天

1 深度学习与药物发现( 一)

1.1 深度神经网络

1.2 正向和反向传播

1.3 优化方法

1.3.1 梯度下降增加动力

1.3.2 自适应学习

1.3.3 Adam

1.4 损失函数

1.4.1 平均绝对误差

1.4.2 均方误差损失函数

1.4.3 交叉熵损失函数

1.5 卷积神经网络

1.5.1 卷积层

1.5.2 填充和步幅

1.5.3 池化层

1.5.4 LeNet 网络

1.5.5 AlexNet 网络

2 深度学习药物发现案例(一)

—— 药物-药物相互作用预测模型


图 2. 利用药物关联网络特征和深度神经网络识别药物之间潜在相互作用事件。

第四天

1 深度学习与药物发现( 二)

1.1 循环神经网络

1.2 消息传递神经网络

1.3 图卷积神经网络

1.4 图注意力神经网络

1.5 图采样和聚合

2 深度学习药物发现案例(二)

—— 药物靶标相互作用预测模型

3 深度学习药物发现案例(三)

—— 药物重定位模型


第五天

1 深度学习与药物发现 (三)

1.1 注意力机制

1.2 自注意力模型

1.3 多头自注意力模型

1.4 交叉注意力模型

1.5 Transformer 模型

2 深度学习药物发现案例(四)

—— 药物-药物相互作用预测模型

3 深度学习药物发现案例(五)

—— 药物靶标结合亲和力预测模型


图 4.将药物和蛋白质信息关联起来的带有注意力区块的AttentionDTA模型

NO.8

蛋白晶体结构解析

内容可向下滑动

第一天

蛋白质结晶前准备

课程介绍和蛋白质结构功能基本介绍

提纯蛋白质,确定浓度、pH值、缓冲液等条件,控制蛋白质稳定性等。

1、目的蛋白质信息检索与调查

- 利用生物信息学工具搜集目标蛋白质的基因序列、结构域、同源蛋白质的信息

- 分析目标蛋白质的理化性质,如分子量、等电点、聚合程度、稳定性等

2、质粒制备

- 设计引物,克隆目标基因到表达载体

- 转化表达宿主,提取重组质粒

- 质粒测序等验证目标基因插入

3、蛋白质纯化

- 选择合适的诱导表达等条件,表达可溶性或不溶性重组蛋白

- 裂解菌体,释放重组蛋白质

- 蛋白质纯化:亲和层析、离子交换层析、凝胶过滤等层析技术的原理和实践等

4、蛋白质不表达和包涵体问题

- 分析不表达的原因,优化诱导条件

- 改进溶解缓冲液条件,提高蛋白从包涵体中释放

5、蛋白质活性鉴定

- 进行Western Blot或酶活性实验验证蛋白质活性

6、蛋白质结晶前分析

- 测定蛋白质的纯度、聚合状态、稳定性等

- 优化缓冲液条件,调整蛋白质到适宜的pH和离子浓度等

第二天

蛋白质结晶与衍射数据收集

利用协同结晶筛选获得蛋白质结晶,在同步辐射光源下收集衍射数据。

1、蛋白质结晶

- 蛋白质结晶的基本原理

- 蛋白质结晶的影响因素

- 蛋白质结晶的基本方法

- 结晶条件筛选策略- 结晶条件筛选策略

- 没有晶体或者改善晶体质量的策略

- 晶体后处理

- 晶体冻存的基本原理和策略

2、SSRF(同步辐射光源) 的介绍

- SSRF简介

- SSRF的光源优势

- SSRF的实验站介绍

3、蛋白质晶体衍射数据收集

- X射线结晶学基本原理

- 晶体探针和晶体定位

- 晶体测试和优化

- 衍射数据收集参数设定和收集策略

- 衍射数据处理和分析

第三天

蛋白质晶体结构解析软件安装

安装相关计算机程序,如Phenix, XDS, Pymol等用于后续的数据处理与模型建立。

1、下载和安装简要介绍

2、蛋白质晶体结构解析软件安装

- CCP4安装

- Phenix安装

- Coot安装

- PyMol安装

- 其他结构解析支持软件安装

依次介绍CCP4、Phenix、Coot、PyMol等主要的结构解析软件的下载和安装方法。也可以介绍一些结构解析中需要的其他软件工具的安装。

Index、integrate与scale & merge等软件使用和介绍

利用软件index及integrate衍射点,scale& merge等处理衍射数据以校正强度。

1、晶体结构学基础知识

- 晶体学中的衍射理论基础

- 布拉格定律和倒易空间

- 晶体的对称性

2、蛋白质晶体结构解析流程

- 蛋白质的表达与纯化

- 蛋白质的结晶

- X射线晶体学数据收集

- 晶体结构解析流程概述

3、Index和integrate

- Indexing的目的和原理

- Integration的目的和过程

4、Scale & merge

- Scale & merge的目的——校正数据

- Scale& merge常用方法

5、使用Scala/XSCALE/Aimless等进行Scale & merge

- Scala/XSCALE/Aimless等软件介绍

- Scala/XSCALE/Aimless进行数据scale& merge的步骤

6、使用HKL2000进行index、integrate和scale & merge

- HKL2000软件介绍

- 使用HKL2000进行indexing

- 使用HKL2000进行integration

- 使用HKL2000进行scaling & merge

第四天

相位解析、电子密度重构、分子结构模型构建修正和优化与结构提交

利用直接法/分子置换法/M(S)AD/M(S)IR 等等相位解析方法确定蛋白质框架,手动模型构建余下结构,进行修正和优化后达到标准后提交蛋白质坐标库。

1、 直接法/分子置换法/M(S)AD/M(S)IR 等方法解析相位

(1)直接法/分子置换法/M(S)AD/M(S)IR等的基本原理

(2) 直接法/分子置换法/M(S)AD/M(S)IR等的目的

(3) 常用的软件介绍

(4) 直接法/分子置换法/M(S)AD/M(S)IR等的具体操作步骤

2.电子密度修饰:

(1)电子密度修饰的基本原理:

(2)电子密度修饰的目的

(3)电子密度修饰的常用软件介绍

(4)电子密度修饰的具体操作步骤

3.电子密度重构

(1)电子密度重构的目的和基本原理

(2)电子密度重构的操作

4、蛋白质晶体结构模型构建

(1) 蛋白质序列比对确定构建起始模型

(2) 主链构建方法

(3) 侧链构建方法

(4) 构建完成后的模型检查

5、蛋白质晶体结构修正与优化

(1) 能量最小化原理

(2) 模拟退火原理

(3) 分子动力学模拟原理

(4) 优化过程中的评估标准

(5)结构修正常用软件介绍

(6)结构修证的具体操作步骤

6、蛋白质晶体结构验证

(1)结构验证的目的和基本原理

(2) Ramachandran图分析

(3) 各类键长和键角分布

(4) 密接点分析

(5) B因子分布

(6) 电子密度匹配度评价

(7)各种指标与统计数据

7、蛋白质晶体结构提交到PDB

(1) PDB数据提交要求

(2) 各项验证确认无误后压缩需提交文件

(3) 在PDB网站提交表单,上传文件,等待审核结果,回复信息

第五天

蛋白质晶体结构展示与分析 、结构与功能的关系

5.1 利用Pymol等软件分析并展示蛋白质的二级结构、三级结构,活性口袋等结构信息。

1、pdb格式文件简介

- pdb文件概述:包含蛋白质晶体学数据的标准格式

- 原子坐标:记录每个原子的xyz坐标

- 温度因子:记录每个原子的热运动参数

- 二级结构:记录α螺旋和β片层的位置

- 结构注解:记录配体、酶活性中心等重要结构信息

2、PyMOL制作蛋白质晶体结构图

- PyMOL简介:流行的分子可视化软件

- 加载pdb文件

- 显示蛋白质链、α螺旋和β片层

- 调整视角、变色和放大关键结构

- 导出高质量图像3、使用PyMOL制作蛋白质配体结合位点信息

- 识别蛋白质与配体的相互作用

- 突出显示配体结合位点残基

- 在结合位点生成表面模型

- 制作配体结合位点的特写图

4、使用PyMOL调查蛋白质的温度因子B-factors

- 显示温度因子putty图

- 分析柔性域和稳定域

- 与酶活性中心和功能位点的关系

5、使用PyMOL重叠对比不同的蛋白质晶体结构

- 载入不同状态的pdb文件

- 重叠对齐蛋白质结构

- 比较构象变化,如酶动力学过程中的不同中间状态6、使用PyMOL显示蛋白质晶体结构中配体的电子密度图

- 加载包含配体密度的pdb文件

- 显示2Fo-Fc 和 Fo-Fc电子密度图

- 检查配体与电子密度的匹配程度

- 评估配体定位和取向的准确性7、使用PyMOL结合Chimera实现同步显示非对称单元的蛋白质分子

- 在PyMOL中显示蛋白质非对称单元

- 在Chimera中同步显示非对称单元

- 细节对比不同分子中的相同结构

- 分析蛋白质多聚体形成的分子间相互作用

5.2 生物大分子结构介绍

5.3 结构与功能关系:

(1)如何分析结构与功能关系:

(2)分析结构的目的:

(3)结构与功能关系的研究手段:

(4)结构能带来什么?

(5)测定结构之后的思路介绍


讲师介绍

01.「CADD计算机辅助药物设计

主讲老师来自国内高校、中科院等单位,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究

02.「AIDD人工智能药物发现与设计

授课老师余老师,有十余年的计算机算法研究和程序设计经验。研究方向涉及生物信息学,深度学习,药物靶标识别,药物不良反应等。参与了国自然基金2项,主持了省厅级科研项目3项。一作身份发表SCI论文数篇,包括BMC Bioinformatics, Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊。

03.「蛋白晶体结构解析

范教授毕业于中国科学院生物物理研究所,师从著名结构生物学家王院士,具有美国耶鲁大学留学六年多的背景,为独立PI。研究方向是结构生物学和免疫学;除了深钻结构生物学和免疫学,还在积极参与和推动结构生物学的教育工作,应邀在多所高校或者科研研究所开展结构生物学课程讲授,在多种国际期刊上发表论文30余篇,均为SCI,作为第一作者或通讯作者4篇一区,包括国际顶尖杂志PNAS两篇,一区top2篇等。并承担国家自然科学基金面上项目等;作为国际著名学术杂志Nature Communication和Journal of Virology, Structure等的审稿人。

04.「CRISPR-Cas9基因编辑技术

主讲老师来自加州大学生物医学工程专业博士,曾在麻省理工和哈佛大学从事基因编辑研究,在耶鲁大学从事基因递送工作。文章发表在Nature Biomedical Engineering, Nature Communications等杂志上。曾在天使投资机构工作,主要投资基因编辑、单细胞测序、AI制药等方向的创业公司。

05.「机器学习代谢组学

主讲老师来自985高校神经科学博士,主要利用代谢组学、转录组学和分子生物学等技术研究神经内科慢性病的发病机制和生物标志物。擅长高效液相色谱-质谱联用(LC-MS)技术进行非靶向和靶向代谢组学从样本制备到数据分析的全流程研究,以及多组学大数据的生物信息学整合分析。5年内在J Clin Invest, EBioMedicine, Cell Death Dis, Cell Death Discov, Nanotoxicology等杂志发表SCI论文10篇。

06.「机器学习微生物组学

主讲老师来自生物科技公司核心高管,曾在麻省理工学院、加州大学旧金山分校等机构工作,过去5年科研工作发表于Cell, PNAS等杂志

07.「深度学习基因组学

主讲老师刘老师,生物信息学博士,有十余年的测序数据分析经验。研究领域涉及人工智能、自然语言处理、功能基因组学、转录组学、miRNA及靶基因网络分析,单细胞测序数据分析,基因调控网络时序分析,蛋白质互作网络分析,多组学联合分析等。主持省自然科学基金等项目4项,发表SCI论文23篇,论著一部。

08.「单细胞测序及空间多组学」

主讲⽼师陈⽼师,加州⼤学戴维斯分校⽣物信息学领域博⼠,加州⼤学旧⾦⼭分校⽣

物信息学博后。⽬前在知名⽣物公司从事⽣物信息分析。具有多年的微⽣物全基因组,微 ⽣物遗传抗病分析,肿瘤遗传变异分析(soma5c muta5ons and germline muta5ons),单细 胞以及空间转录组学数据分析等,并开发了检测肿瘤样品 CNVs。以第⼀或共同作者发表 ⽂章在 Genome Biology, Cell 等知名期刊。

授课时间及地点

CADD计算机辅助药物设计

2024.05.11-2024.05.12全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.13-2024.05.16晚上授课(晚19:00—晚22:00)

2024,05.19全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.20-2023.05.23晚上授课(晚19:00—晚22:00)

腾讯会议直播形式

机器学习代谢组学

2024.05.11-2024.05.12全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.13-2024.05.14晚上授课(晚19:00—晚22:00)

2024.05.18-2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

腾讯会议直播形式

深度学习基因组学

2024.05.11-2024.05.12全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.18-2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.25-2024.05.26全天授课(上午9:00-11:30下午13:30-17:00

腾讯会议直播形式

机器学习微生物

2024.05.14-2024.05.17晚上授课(晚19:00—晚22:00)

2024.05.18-2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.20-2024.05.21晚上授课(晚19:00—晚22:00)

腾讯会议直播形式

CRISPR-Cas9基因编辑技术

2024.05.11-2024.05.12全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.13-2024.05.14晚上授课(晚19:00—晚22:00)

2024.05.18-2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

腾讯会议直播形式

蛋白晶体结构解析

2024.05.13-2024.05.16晚上授课(晚19:00—晚22:00)

2024.05.18-2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.21-2024.05.22晚上授课(晚19:00—晚22:00)

腾讯会议直播形式

AIDD人工智能药物发现与设计

2024.05.14-2024.05.17晚上授课(晚19:00—晚22:00)

2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.20-2024.05.23晚上授课(晚19:00—晚22:00)

腾讯会议直播形式

单细胞测序及空间多组学

2024.05.11-2024.05.12全天授课(上午9:00-11:30下午13:30-17:00)

2024.05.13-2024.05.14晚上授课(晚19:00—晚22:00)

2024.05.18-2024.05.19全天授课(上午9:00-11:30下午13:30-17:00)

腾讯会议直播形式

报名费用及福利

CADD计算机辅助药物设计;AIDD人工智能药物发现;

蛋白晶体结构解析;深度学习基因组学;

每班公费价:5880

每班自费价:5480

机器学习代谢组学;机器学习微生物组学;单细胞测序及空间多组学

CRISPR-Cas9基因编辑;(机器学习生物医学免费赠送)

每班公费价:5380

每班自费价:5080

优惠一:两班同报9880元另外赠送一个学习名额(可任意选择一个课程赠送)

优惠二:三班同报13880元另外赠送一个学习名额(可任意选择一个课程赠送)

优惠三:四班同报17880元另外赠送两个学习名额(可任意选择两个课程赠送)

优惠四:全部报名学习25880元(一年内可免费参加我司举办的任何课程,不限课程及次数)

福利:报名缴费后即可获得往期全套视频回放及PPT资料提供预习

结业证书:参加培训并通过考试的学员,可以获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org

学员反馈


官方联系人/扫码咨询详情

联系人:苏老师

电话:18638251323

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大量品牌撤场、商场“摆烂”!广州首个策展型商业要关了

大量品牌撤场、商场“摆烂”!广州首个策展型商业要关了

赢商网新媒体
2024-04-30 20:38:24
没钱装修我住进毛坯房,水泥书桌砖头茶几,女朋友见了也嫌弃

没钱装修我住进毛坯房,水泥书桌砖头茶几,女朋友见了也嫌弃

装修设计案例精选
2024-04-30 08:25:28
复旦44岁博士与35岁女硕士结婚,2个月后才知妻子真实身份

复旦44岁博士与35岁女硕士结婚,2个月后才知妻子真实身份

莉雅细细谈
2024-04-23 20:16:02
一对老夫妻的悔悟:退休后,一个错误的决定,让晚年生活大打折扣

一对老夫妻的悔悟:退休后,一个错误的决定,让晚年生活大打折扣

小青说说
2024-04-29 14:36:25
教练确认双马甚至三马都打不了 就怕沧州知道申花没外援 卯足劲踢

教练确认双马甚至三马都打不了 就怕沧州知道申花没外援 卯足劲踢

体育大百科
2024-04-30 21:29:59
中法两军建立战区间合作对话机制

中法两军建立战区间合作对话机制

界面新闻
2024-04-26 09:58:47
定了,iPhone 16 全系外观再无悬念

定了,iPhone 16 全系外观再无悬念

果粉俱乐部
2024-04-30 11:41:13
事关退市,沪深交易所重磅发布!

事关退市,沪深交易所重磅发布!

证券时报
2024-04-30 20:55:07
周鸿祎以990万价格拍掉迈巴赫;淘宝、京东均取消618预售模式…

周鸿祎以990万价格拍掉迈巴赫;淘宝、京东均取消618预售模式…

媒体训练营
2024-04-29 10:47:07
万科再发声!管理层将增持,郁亮:股价距自己要求很远!大股东重申支持

万科再发声!管理层将增持,郁亮:股价距自己要求很远!大股东重申支持

证券时报e公司
2024-04-30 18:34:53
国际评级机构穆迪再次下调了万科的评级

国际评级机构穆迪再次下调了万科的评级

侦姐有料
2024-04-28 07:52:41
新交的女朋友不但身材好,下面也是一流

新交的女朋友不但身材好,下面也是一流

匹夫来搞笑
2024-04-30 07:45:23
大陆航母福建舰不得了?前海军舰长:是翻天覆地的改变

大陆航母福建舰不得了?前海军舰长:是翻天覆地的改变

金瓯一统
2024-05-01 06:50:10
被许钟豪弄伤,任俊飞摊牌发声,官宣决定,朱芳雨批准,杜锋遗憾

被许钟豪弄伤,任俊飞摊牌发声,官宣决定,朱芳雨批准,杜锋遗憾

东球弟
2024-04-30 11:28:56
“80后”博士徐纪敏,任四川省华蓥市委书记

“80后”博士徐纪敏,任四川省华蓥市委书记

前沿天地
2024-04-30 23:49:19
破天荒!国际刑事法院要以战争罪通缉内塔尼亚胡?美国同意了吗?

破天荒!国际刑事法院要以战争罪通缉内塔尼亚胡?美国同意了吗?

凉羽亭
2024-05-01 07:10:24
皇马2-2却稳了?回主场1-0就进欧冠决赛 成功率96%

皇马2-2却稳了?回主场1-0就进欧冠决赛 成功率96%

念洲
2024-05-01 05:55:32
易建联2个儿子参加训练营,哥俩同时亮相,球商极高+展现惊人天赋

易建联2个儿子参加训练营,哥俩同时亮相,球商极高+展现惊人天赋

大咖唠体育
2024-04-30 14:08:41
武汉新城又一“动脉”正式通车,全长8.3公里

武汉新城又一“动脉”正式通车,全长8.3公里

极目新闻
2024-04-30 18:10:29
闹大了!教育领域严查大战正式打响,谁将成为下一个牺牲品?

闹大了!教育领域严查大战正式打响,谁将成为下一个牺牲品?

一口娱乐
2024-04-30 17:52:14
2024-05-01 07:58:44
CBG资讯
CBG资讯
大化学知识及经验共享平台
3728文章数 262关注度
往期回顾 全部

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

英方称将完全移除敏感场地的中国监控设备 中使馆回应

头条要闻

英方称将完全移除敏感场地的中国监控设备 中使馆回应

体育要闻

诺伊尔:今天氛围很好让我想起了12年决赛;我们想去温布利

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

查道炯:中国经济的外部挑战与应对思考

汽车要闻

越野老炮最爱 哈弗新H9新增2.4T柴油机

态度原创

房产
亲子
旅游
时尚
军事航空

房产要闻

刺激!市区惊现1.1w/㎡新房+现房!海口楼市,五一打响价格战!

亲子要闻

4岁萌娃跳街舞,不仅会卡点 而且动作记得住

旅游要闻

五一大雨,浇灭了多少旅游城市的心气?

岁月不败美人,姐姐们的50岁也太好看了

军事要闻

以官员:以总理求助拜登阻止逮捕令

无障碍浏览 进入关怀版