网易首页 > 网易号 > 正文 申请入驻

5分钟搭建强大又好用的深度学习环境

0
分享至

为深度学习项目建立一个良好的环境不是一件容易的任务。因为需要处理的事情太多了:库必须匹配特定的版本,整个环境需要可以复制到其他机器上,所有东西都需要能够机器中的所有驱动程序通信。这意味着你需要为你的NVIDIA GPU安装特定的驱动程序,并且CUDA库必须与你的驱动程序和你想要使用的框架兼容。

随着容器彻底改变了软件开发的世界,现在它们也可以帮助数据科学家构建更健壮的环境。

有一件事是肯定的:数据科学可以从软件开发领域学到一些东西。

NVIDIA NGC是一个软件中心,提供gpu优化框架、预训练模型和工具包来培训和部署生产中的AI。它是一个容器注册中心,包含训练模型所需的所有工具:无论您使用的是caffee2、Pytorch、Tensorflow、Keras、Julia还是其他工具都没有关系。

在NGC目录中有大量可生产的容器,你只需要选择你自己想用的。

Nvidia NGC不仅是一个容器注册中心,它还内置了许多功能,可以帮助您的组织将模型带到生产环境中。

从头开始

让我们从一台配备了GPU的Linux机器开始(GPU不是强制性的,但如果你想训练模型,强烈建议使用GPU)。我在Ubuntu 20.04 LTS和18.04 LTS上测试了这个功能,但是可以很容易地适应其他Linux发行版。

我们需要做什么?

步骤很简单,我们只需要安装NVIDIA驱动程序和Docker。然后我们下载我们想要的docker镜像并开始工作!

第一步:在Ubuntu 20.04上安装NVIDIA驱动程序

注意:如果你使用的是另一个Ubuntu版本,请确保你修改了相应的脚本。此外,如果启用了Secure Boot,这种方法也不起作用。

sudo apt install linux-headers-$(uname -r)
curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv - fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
sudo apt update
sudo apt -y install cuda

使用nvidia-smi命令验证安装。你应该看到这样的东西。

第二步:在Ubuntu 20.04中安装Docker

#!/bin/sh
#Set up the repository
sudo apt-get update
sudo apt-get install -y \
apt-transport-https \
ca-certificates \
curl \
gnupg-agent \
software-properties-common
# Add Docker’s official GPG key:
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
# set up the stable repository
sudo add-apt-repository \
"deb [arch=amd64] https://download.docker.com/linux/ubuntu \
$(lsb_release -cs) \
stable"
sudo apt-get update
sudo apt-get install -y docker-ce docker-ce-cli containerd.io
# Substitute ubuntu with your username
sudo usermod -aG docker ubuntu

注意:你需要注销和登录,以在没有sudo权限的情况下使用docker命令。

第三步:让Docker与NVIDIA driver通信

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu16.04/amd64/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt update
sudo apt-get install -y docker nvidia-container-toolkit

我们现在想测试Docker是否能够与NVIDIA驱动程序通信。要做到这一点,只需运行以下命令,您应该会看到与步骤1类似的结果。

sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

注意:我在不同的云主机提供商上试验过,根据操作系统、虚拟机类型和gpu,此时可能需要重启。因此,如果出现错误,请尝试sudo reboot并再次执行上述命令。正常的话应该看到nvidia-smi结果。

第四步:让我们获取镜像并运行它!

#Download NGC Tensorflow 2 Image
docker pull nvcr.io/nvidia/tensorflow:20.12-tf2-py3
# create local_dir folder mounted at /container_dir in the container
mkdir /home/ubuntu/local_dir
docker run --gpus all --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 -it --rm -v /home/ubuntu/local_dir:/container_dir nvcr.io/nvidia/tensorflow:20.10-tf2-py3

注意:flags - shm-size=1g - ulimit memlock=-1 - ulimit stack=67108864是必要的,为了避免操作系统限制资源分配给Docker容器。

我们现在进入了容器,让我们看看是否一切正常。

正如你从图片中看到的,GPU是可用的,tensorflow可以使用它。

最后:访问docker环境

当您断开与机器的连接时,您将注意到您已经不在容器内了。

要再次连接,你需要使用docker ps找到正在运行的容器的container_ id,然后:

docker exec -it id> /bin/bashid>

最后总结

在本教程中,我们发现使用NVIDIA NGC的图像创建一个具有所有库和工具的生产就绪环境是多么容易。

我们看到了配置Docker使其与NVIDIA驱动程序和所需框架通信是多么容易。

我们在5分钟内完成了所有这些工作

作者:Roberto Di Bella

原文地址:https://towardsdatascience.com/a-5-minutes-production-ready-setup-for-your-deep-learning-project-9ff860fc3c4b

deeohub翻译组

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不出5年,中国贬值最快的不是房子、股票,而是这3个东西

不出5年,中国贬值最快的不是房子、股票,而是这3个东西

庞明说财经
2024-04-16 22:29:34
深圳市“巨贪”市长拘留期“插喉”自杀,贪污20亿,被捕时卡里只有3585元

深圳市“巨贪”市长拘留期“插喉”自杀,贪污20亿,被捕时卡里只有3585元

天闻地知
2024-04-22 18:01:04
麦穗丰连续评价许钟豪:谁开始得分就对谁下黑手 全国人民都看着

麦穗丰连续评价许钟豪:谁开始得分就对谁下黑手 全国人民都看着

直播吧
2024-04-25 21:47:32
当年为救钱学森,中国付出了什么代价?筹码大到让美国无法拒绝!

当年为救钱学森,中国付出了什么代价?筹码大到让美国无法拒绝!

可乐88
2024-04-15 09:01:57
乌克兰称S-500是对爱国者防空系统“拙劣”模仿,落后至少四十年

乌克兰称S-500是对爱国者防空系统“拙劣”模仿,落后至少四十年

探索星空
2024-04-25 10:46:52
一个转正小三的悔悟:接受已婚男人的结果,生活中处处都是鸡毛

一个转正小三的悔悟:接受已婚男人的结果,生活中处处都是鸡毛

阿琪故事说
2024-04-25 08:57:01
32岁女星金靖官宣怀孕!出道8年从未结婚,一家五口包含两位爱犬

32岁女星金靖官宣怀孕!出道8年从未结婚,一家五口包含两位爱犬

快乐娱文
2024-04-25 16:02:28
4万枚炮弹或运抵俄罗斯,美铁杆盟友叛美援俄,拜登气得脸色铁青

4万枚炮弹或运抵俄罗斯,美铁杆盟友叛美援俄,拜登气得脸色铁青

小lu侃侃而谈
2024-04-25 15:47:19
五一假期7天变5天,“罪魁祸首”是清华教授,劳动者权益谁来保障

五一假期7天变5天,“罪魁祸首”是清华教授,劳动者权益谁来保障

一口娱乐
2024-04-25 21:13:38
世界上最好的养生,就两个字!

世界上最好的养生,就两个字!

大禹小城
2024-04-23 14:23:34
女生为啥要穿“开裆连裤袜”?难道是因为她们喜欢吗?

女生为啥要穿“开裆连裤袜”?难道是因为她们喜欢吗?

今日养生之道
2024-04-26 07:30:38
中国承诺帮古巴建设军队后,我军公开巨浪2试射,美司令警告中国

中国承诺帮古巴建设军队后,我军公开巨浪2试射,美司令警告中国

DS北风
2024-04-24 11:56:20
外媒:美商务部致信美国会,称正审查中国使用RISC-V芯片技术带来的“风险”,借口还是“国家安全”

外媒:美商务部致信美国会,称正审查中国使用RISC-V芯片技术带来的“风险”,借口还是“国家安全”

环球网资讯
2024-04-25 15:02:31
男子遮挡号牌被扣9分竟央求打个折,交警:这不是菜市场

男子遮挡号牌被扣9分竟央求打个折,交警:这不是菜市场

极目新闻
2024-04-25 19:28:34
海南省纪委监委通报,6人被处理!

海南省纪委监委通报,6人被处理!

鲁中晨报
2024-04-26 09:41:03
沈阳楼市全军覆没,沈阳和平区房价从15000元降至13000元最新分析

沈阳楼市全军覆没,沈阳和平区房价从15000元降至13000元最新分析

有事问彭叔
2024-04-23 17:41:10
实体经济不死,天理难容,男子开面馆日均100份,每月房租2.3万

实体经济不死,天理难容,男子开面馆日均100份,每月房租2.3万

坠入二次元的海洋
2024-04-24 20:58:08
航天员桂海潮,再创新纪录

航天员桂海潮,再创新纪录

搞笑的阿票
2024-04-26 07:22:50
华为Pura 70平息争议:已修复AI消除衣服Bug

华为Pura 70平息争议:已修复AI消除衣服Bug

PChome电脑之家
2024-04-25 10:24:54
戚薇不建议大家瘦成艺人的样子 ,因这是工种需要,网友表示认可

戚薇不建议大家瘦成艺人的样子 ,因这是工种需要,网友表示认可

娱乐寡姐
2024-04-25 21:46:28
2024-04-26 10:26:46
deephub
deephub
CV NLP和数据挖掘知识
1322文章数 1413关注度
往期回顾 全部

科技要闻

雷军周鸿祎出圈:中年CEO,抢着当网红

头条要闻

牛弹琴:"欧洲一姐"被指比美国还美国 马克龙想炒掉她

头条要闻

牛弹琴:"欧洲一姐"被指比美国还美国 马克龙想炒掉她

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

心疼!伊能静曝儿子曾被狗仔追到洗手间

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

全新哈弗H9亮相 大号方盒子硬派SUV入列

态度原创

艺术
时尚
教育
旅游
数码

艺术要闻

艺术名画︱爱尔兰画家大卫·科因的刀画作品

女人再美不如会穿!参考这些搭配解析更有魅力,美到老很简单

教育要闻

继续蔓延!悉尼大学加入校园反战抗议活动

旅游要闻

京都热门景点一棵樱花树突然倒下 游客被砸成重伤

数码要闻

三星面临OLED产能挑战 11英寸iPad Pro初期供货受影响

无障碍浏览 进入关怀版