前景提要
萧箫发自凹非寺
量子位报道公众号 QbitAI
加载完 Python 的 Docker 镜像后,顺手又装了个 Python?
这样的「误会」,在你看完这篇对 Python 的 Docker“正式版镜像”的解读后,就会烟消云散。
不仅可以了解到 Docker 镜像的结构、功能,还能对 Docker 的印象有所改观:容器看起来真的比虚拟机好用!
下面以“Python 正式版”为例,具体来了解一下 Docker 镜像的用法和细节。
Docker 镜像这样用
这个镜像的 基础镜像 是 Debian GNU/Linux 10,是 Debian 系统最新的一款名为 Buster 的版本。
Tips:Buster 是《玩具总动员》中安迪的狗子,Debian 开发组喜欢用这款电影里的角色命名系统版本。
也就是说,这是个基于 Linux 的镜像,不仅能保证稳定性,还能提供 bug 修复。
接下来,是文件中的 环境变量 。
务必确认在 PATH 前面加路径,也就是你安装镜像的地方,这样能保证用到的是安装的镜像。
此外,也确认一下语言的环境变量,不过 Python3 已经默认 UTF-8,所以这一步不一定要做。
当然,也可以确认一下 Python 的最新版本(图中是 3.8.5)。
确认环境变量后,是关于 运行依赖 的事情。
事实上,为了能运行,Python 需要依赖一些额外的软件包。
其中,ca-certificates 相当于一个证书列表,类似于浏览器用来验证 https://url/ 的证书,这也是 Python,wget 和其他工具用来验证服务器的证书。
至于 netbase,则用来安装一些/etc 中的文件,通常用于将确切的名称映射到某些端口。
例如,/etc/services 就会映射到 443/tcp 端口上。
在那之后,就是 Python 的安装 了。
一个编译器工具链会被安装,而 Python 代码也会被下载、编译,而不需要的 Debian 安装包也会被删掉。
在这其中,最核心的部分有如下三点: 1. Python 会被安装到/usr/local 位置下
2. 所有的 .pyc 文件都会被删掉
3. 一旦 gcc 等安装包对编译 Python 不再有用,那它们也会被删掉
而所有的这些,都只需要通过 RUN 命令来实现。
也许你会注意到,在这个过程中,Python 编译了 libbluetooth-dev。事实上,Python 镜像的确有 蓝牙 接口,不过需要安装对应的安装包。
此外,在 设置别名 上,在/usr/local/bin/python3 和/usr/local/bin/python 间,可以随意选一个名称来用(反正是一样的)。
最后,是安装 pip,事实上,Docker 会确保安装的是新版本的 pip,即它有自己的时间表,即使可能距离 Python 上一版发布已经过了很久。
在这个过程中,所有的 .pyc 文件都会被删除。
done!好了,怎么运行?
事实上,一句话就够了。
此外,如果在使用 CMD 时 ENTRYPOINT 为空,你的 Python 会在运行镜像时被默认运行。
也可以根据需要,指定其他可执行文件。
一些你可能不知道的 tips
虽然大多数人不会犯这个错误,不过对于一些新手小白来说,还是可能在装上 Python 的 Docker 镜像后,顺手又装了个 Python。
这样的话,会导致两个 Python 在镜像中「打架」,造成不必要的混乱。
此外,Python 的官方图片往往也 包含了最新的 pip 。
虽然 Python3.5 的最后一个版本都是去年年末的事情了,不过即使是 3.5 的安装,也会带上最新的 pip。
还要注意的一点是,这个镜像安装后会删掉所有的 .pyc 文件。
此外,这个正式版镜像并没有安装 Debian 的安全更新,可能需要你手动安装一下。
经过一番操作后,你就可以放心地使用 Python 的 Docker 镜像,在上面运行相应的程序了。
那么,Docker 到底与虚拟机有什么不同?
Docker 与虚拟机的区别
作为一个容器,Docker 有点像虚拟机,本质上都是为了在不同环境中编写的各种程序而生。
这是因为,编程语言总是会随着环境的更新而迭代,在 Python 更新了新版后,有人调侃 Python2 和 Python3 看起来根本不是一种语言。
如果开发了一个 Python3 的程序,但测试和生产的环境只装了 Python2,运行过程中就可能出现各种鸡飞狗跳的事情。
不过与虚拟机不同的是,Docker 不用再自己装个 操作系统 了,而这个东西,恰恰是最占地方的。
Docker 将程序中要用到的各种环境「零件」和程序一起打包,做成一个镜像,这样使用者只需要加载这一个镜像,就可以直接运行程序。
相比于在电脑上加载好几个虚拟机,占用大半空间,Docker 不失为只有一台电脑时,运行各种程序的好选择。
作者介绍
Itamar Turner-Trauring 有 20 多年的科学计算和分布式系统经验,写过 Twisted 网络框架,也在谷歌工作过,为 Google Flight 贡献过后端 C++ 代码。
1996-2000 年,Itamar Turner-Trauring 在巴伊兰大学和特拉维夫大学(以色列排名第二和第一的大学)学习数学与计算机课程,并于 2009 年在哈佛大学取得文科学士学位,研究方向是人文学科。
现阶段,Itamar Turner-Trauring 会撰写 Python 相关的技术文章,帮助开发者更快上手这款编程语言。
参考链接:
https://pythonspeed.com/articles/official-python-docker-image/