Docker 包含三个基本概念,分别是镜像(Image)、容器(Container)和仓库(Repository)。Docker 镜像可以看作是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像是 Docker 运行容器的前提,是Docker的核心。要想利用Docker镜像快速构建一个高性能的应用,首先你要制作一个好的镜像。
如何制作一个好的镜像?下面教你几个小诀窍。
一、明确指定镜像版本,管理更方便
为了让版本管理起来更方便,应用部署速度更快,在创建镜像的过程中,建议工程师们明确指定包含版本或者其他辅助信息的tag。如果不指定镜像tag,默认会使用latest。这样,每次启动应用实例时,都需要去镜像仓库检查镜像是否更新。这种方式不利于版本管理,对应用启动速度也有一定影响。
二、减小镜像体积
1、使用alpine版本的基础镜像,来减小镜像体积,以保证部署和扩容速度。
alpine是一个高度精简但又包含了基本工具的轻量级Linux发行版,本身的Docker镜像只有4~5M大小,各开发语言和框架都有基于alpine制作的基础镜像。因此,在开发自己应用的镜像时,要选择这些镜像作为基础镜像,这样可以大大减小镜像的体积。
如下是各种语言对应的基础镜像:
- Java(Spring Boot): - openjdk:8-jdk-alpine,openjdk:8-jre-alpine等
- Java(Tomcat) - tomcat:8.5-alpine等
- Nodejs - node:9-alpine, node:8-alpine等
- Python - python:3-alpine, python:2-alpine等
- PHP - 基于php:7-fpm-alpine,php:5-fpm-alpine等镜像添加nginx,参考https://hub.docker.com/r/trafex/alpine-nginx-php7/
- Ruby:ruby:2-alpine等
- Go/可执行文件 - 直接基于alpine镜像,把编译后的可执行文件打入镜像。因为alpine不同于普通的Ubuntu/Centos等发行版,需要静态编译和链接应用代码,例如Go需要关闭cgo:CGO_ENABLED=0 go build ...
- 静态页面 - nginx:1-alpine等
2、保证Dockerfile中的清理命令在同一行,也可以减小镜像体积。
Dockerfile的每条指令都会产生一个文件层,文件层越多镜像体积就越大。因此,对于不需要产生文件层的命令,要尽量合并到一起。比如,组件的安装清理就可以放在一条命令里面。如下:
三、减小镜像传输大小
Docker在build镜像的时候,如果某个命令相关的内容没有变化,会使用上一次缓存(cache)的文件层,在上传到镜像仓库时,这一层也就不需要上传了。利用这一点,在添加应用的时候可以分层添加,具体操作如下:
(1)将不变或者变化很少的体积较大的依赖库和经常修改的自有代码分开。
(2)因为cache缓存在运行Dockerbuild命令的本地机器上,因此,建议固定使用某台机器来进行Docker build,以便利用cache。
举个例子:
在构建Spring Boot应用镜像,我们可以通过以下操作来进行分层。
1、在Dockerfile所在目录,解压缩maven生成的jar包
unzip <path-to-app-jar>.jar -d app
2、在Dockerfile中我们把应用的内容分成4个部分COPY到镜像里面:其中前面3个基本不变,第4个是经常变化的自有代码。最后一行是解压缩后,启动spring boot应用的方式。如下:
四、避免使用进程管理程序来保证应用健康运行
在应用的某个实例崩溃或者非正常退出时,很多进程管理程序并不退出,导致平台无法检测到应用已经不可用,进而无法重启应用。所以,要避免使用这类进程管理程序来启动镜像。
五、保证数据和日志持久化存储
1、避免使用本地存储。应用镜像启动后,文件系统是临时的,崩溃后即被销毁。持久化数据,文件等需要存储到SDS,FDS等后端存储服务中
2、应用日志不能写到本地文件,需要写到标准输出或者标准错误,平台负责收集、汇总和后续的各种处理