0. 前言

最近需要使用到 Docker, 记一下笔记和常用的操作。主要是参考菜鸟教程和阮一峰老师的教程。

1. 启动Docker服务

# service 命令的用法
$ sudo service docker start

# systemctl 命令的用法
$ sudo systemctl start docker

2. Image

2.1 本地 image 管理

Docker 把应用程序及其依赖，打包在 image 文件里面。 只有通过这个文件，才能生成 Docker 容器。

image 文件可以看作是容器的模板 Docker 根据 image 文件生成容器的实例。同一个 image 文件，可以生成多个同时运行的容器实例。

# 列出本机的所有 image 文件。
$ docker image ls
$ docler images
REPOSITORY    TAG       IMAGE ID       CREATED        SIZE
ubuntu        latest    fb52e22af1b0   2 weeks ago    72.8MB
hello-world   latest    d1165f221234   6 months ago   13.3kB
ubuntu        15.10     9b9cb95443b5   5 years ago    137MB
#仓库源		标签		ID				创建时间		大小

# 删除 image 文件
$ docker image rm [imageName]

image 文件是通用的，一台机器的 image 文件拷贝到另一台机器，照样可以使用。一般来说，为了节省时间，我们应该尽量使用别人制作好的 image 文件，而不是自己制作。即使要定制，也应该基于别人的 image 文件进行加工，而不是从零开始制作。
为了方便共享，image 文件制作完成后，可以上传到网上的仓库。Docker 的官方仓库 Docker Hub 是最重要、最常用的 image 仓库。此外，出售自己制作的 image 文件也是可以的。

2.2 查找Image

我们可以从 Docker Hub 网站来搜索镜像，Docker Hub 网址为： https://hub.docker.com/

我们也可以使用 docker search 命令来搜索镜像。比如

$ docker search gpgpusim
NAME                                DESCRIPTION                                 STARS     OFFICIAL AUTOMATED
findhao/gpgpusim_runtime            gpgpusim docker                                 0                [OK]
pli11/gpgpusim                                                                      0                    
syuan3/gpgpusim                     a docker container for gpgpusim simulaator      0                    
socalucr/gpgpusim-homework          Container used to evaluate GPU homework @UCR    0                    
pitipat1998/gpgpusim                                                                0                    
yhgong/gpgpusimdev_200318                                                           0                    
lemonsien/gpgpusim                                                                  0                    
jefferlee/gpgpusim_runtime                                                          0                    
msharmavikram/gpgpusimdnn           The repository has all required elements for…   0                    
minttmdgh/gpgpusim-setting          default                                         0                    
marziehlenjani/gpgpusimwithcuda11                                                   0                    
sis013/injesim4                     gpgpusim-4.0 with jonghyun                      0     
#仓库源的名称							镜像描述				         类似github star 是否docker官方发布 自动构建

2.3 pull镜像

使用命令 docker pull 来下载镜像

$ docker pull findhao/gpgpusim_runtime
$ docker pull ubuntu:20.04

没想到 UCR 那个还挺大的，下了一会儿失败了，换成了 findhao/gpgpusim_runtime

2.4 运行镜像

$ docker run -it findhao/gpgpusim_runtime
$ docker run -it ubuntu:20.04 /bin/bash

选项

--gpus all: 把所有 GPU 映射到镜像

2.5 创建镜像

两种方法

从已经创建的容器中更新镜像，并且提交这个镜像。即把容器快照导入镜像
使用 Dockerfile 指令来创建一个新的镜像

2.5.1 更新镜像

更新镜像之前，我们需要使用镜像来创建一个容器

$ docker run -t -i ubuntu:15.10 /bin/bash
root@b251c90ca048:/#

在运行的容器内使用 apt-get update 命令进行更新。

在完成操作之后，输入 exit 命令来退出这个容器。

此时 ID 为 b251c90ca048 的容器，是按我们的需求更改的容器。我们可以通过命令 docker commit 来提交容器副本。

$ docker commit -m="has update" -a="cory" b251c90ca048  huweim/ubuntu:v2
#-m 描述信息 -a 指定作者 b251c90ca048 容器ID huweim/ubuntu:v2 创建的目标镜像名
sha256:93069e854b178767dfcd334c8ce99d29141fdc87719c2bb1251d9e16e255de73

也就是我们在镜像中做了修改，随时更新保存为新的镜像即可

2.5.2 构建镜像

2.5.2.1 Dockerfile

首先，在项目的根目录下，新建一个文本文件.dockerignore，写入下面的内容。

.git
node_modules
npm-debug.log

上面代码表示，这三个路径要排除，不要打包进入 image 文件。如果你没有路径要排除，这个文件可以不新建。

我们使用命令 docker build ，从零开始来创建一个新的镜像。为此，我们需要创建一个 Dockerfile 文件，其中包含一组指令来告诉 Docker 如何构建我们的镜像。

每一个指令都会在镜像上创建一个新的层，每一个指令的前缀都必须是大写的。

$ touch Dockerfile 
$ gedit Dockerfile

FROM node:8.4 #该 image 文件继承官方的 node image，冒号表示标签，这里标签是8.4，即8.4版本的 node。
COPY . /app #将当前目录下的所有文件（除了.dockerignore排除的路径），都拷贝进入 image 文件的/app目录。
WORKDIR /app #指定接下来的工作路径为/app。
RUN npm install --registry=https://registry.npm.taobao.org #在/app目录下，运行npm install命令安装依赖。注意，安装后所有的依赖，都将打包进入 image 文件。
EXPOSE 3000 #将容器 3000 端口暴露出来， 允许外部连接这个端口。
CMD node demos/01.js

Ubuntu 我自己使用 touch Dockerfile, 然后 gedit Dockfile 去编辑

2.5.2.2 Docker build

有了 Dockerfile 文件以后，就可以使用docker image build命令创建 image 文件了。

$ docker image build -t koa-demo .
# 或者
$ docker image build -t koa-demo:0.0.1 .
#-t: IMAGE名字 .: Dockerfile 文件所在目录，可以指定 Dockerfile 的绝对路径

使用 Dockerfile 文件，通过 docker build 命令来构建一个镜像。

在 Desktop 下可以跑

$ docker build -t runoob/centos:6.7 .
#-t: 指定要创建的目标镜像名      .: Dockerfile 文件所在目录，可以指定Dockerfile 的绝对路径

可以跑起来，不过太大了中途终止掉

2.5.3 设置镜像标签

$ docker tag IMAGEID runoob/centos:dev

2.5.4 生成容器

$ docker container run -p 8000:3000 -it koa-demo /bin/bash
# 或者
$ docker container run -p 8000:3000 -it koa-demo:0.0.1 /bin/bash
#-p: 容器的 3000 端口映射到本机的 8000 端口
#-it: 容器的 Shell 映射到当前的 Shell，然后你在本机窗口输入的命令，就会传入容器。也就是交互式
#koa-demo: IMAGE名字，如果有标签，还需要提供标签，默认是 latest 标签
#/bin/bash: 容器启动以后，内部第一个执行的命令。这里是启动 Bash，保证用户可以使用 Shell。

可以使用docker container run命令的--rm参数，在容器终止运行后自动删除容器文件。

2.5.5 CMD命令

上一节的例子里面，容器启动以后，需要手动输入命令node demos/01.js。我们可以把这个命令写在 Dockerfile 里面，这样容器启动以后，这个命令就已经执行了，不用再手动输入了。

CMD node demos/01.js，它表示容器启动后自动执行node demos/01.js。

你可能会问，RUN命令与CMD命令的区别在哪里？简单说，RUN命令在 image 文件的构建阶段执行，执行结果都会打包进入 image 文件；CMD命令则是在容器启动后执行。另外，一个 Dockerfile 可以包含多个RUN命令，但是只能有一个CMD命令。
注意，指定了CMD命令以后，docker container run命令就不能附加命令了（比如前面的/bin/bash），否则它会覆盖CMD命令。现在，启动容器可以使用下面的命令。

$ docker container run --rm -p 8000:3000 -it koa-demo:0.0.1

2.6 删除镜像

$ docker rmi IMAGE_ID
$ docker rmi IMAGE_NAME:TAG

3. 实例：hello world

首先，运行下面的命令，将 image 文件从仓库抓取到本地。

$ docker image pull library/hello-world

上面代码中，docker image pull是抓取 image 文件的命令。library/hello-world是 image 文件在仓库里面的位置，其中library是 image 文件所在的组，hello-world是 image 文件的名字。

由于 Docker 官方提供的 image 文件，都放在library组里面，所以它的是默认组，可以省略。因此，上面的命令可以写成下面这样。

$ docker image pull hello-world

在本机看到这个 image 文件

$ docker image ls

运行这个 image 文件

$ docker container run hello-world

docker container run命令会从 image 文件，生成一个正在运行的容器实例。

注意，docker container run命令具有自动抓取 image 文件的功能。如果发现本地没有指定的 image 文件，就会从仓库自动抓取。因此，前面的docker image pull命令并不是必需的步骤。

如果运行成功，你会在屏幕上读到下面的输出。
$ docker container run hello-world

Hello from Docker!
This message shows that your installation appears to be working correctly.

... ...

输出这段提示以后，hello world就会停止运行，容器自动终止。

有些容器不会自动终止，因为提供的是服务。比如，安装运行 Ubuntu 的 image，就可以在命令行体验 Ubuntu 系统。

$ docker container run -it ubuntu bash	#-i交互式操作 -t 终端

对于那些不会自动终止的容器，必须使用docker container kill 命令手动终止。

$ docker container kill [containID]

4. Container

image 文件生成的容器实例，本身也是一个文件，称为容器文件。 也就是说，一旦容器生成，就会同时存在两个文件： image 文件和容器文件。而且关闭容器并不会删除容器文件，只是容器停止运行而已。

# 列出本机正在运行的容器
$ docker container ls
$ docker ps #应该是一样的效果

# 列出本机所有容器，包括终止运行的容器
$ docker container ls --all
$ docker ps -a

上面命令的输出结果之中，包括容器的 ID。很多地方都需要提供这个 ID，比如上一节终止容器运行的docker container kill命令。

4.1 删除容器

终止运行的容器文件，依然会占据硬盘空间，可以使用docker container rm命令删除。

$ docker container rm [containerID]
$ docker container prune #清理所有处于终止状态的容器。

运行上面的命令之后，再使用docker container ls --all命令，就会发现被删除的容器文件已经消失了。

4.2 停止容器

$ docker stop <容器 ID>

4.3 启动已停止的容器

使用 docker start 启动一个已停止的容器

$ docker start b750bbbcfd88	#ID

4.4 后台运行

在大部分的场景下，我们希望 docker 的服务是在后台运行的，我们可以过 -d 指定容器的运行模式。

$ docker container run -itd --name ubuntu-test ubuntu /bin/bash

**注：**加了 -d 参数默认不会进入容器，想要进入容器需要使用指令 docker exec（下面会介绍到）

NOTE: If you want to detach (push it to background) from the container without shutting it down, use ctrl+p+q Remember that $ exit would shutdown the container.

4.4.1 进入容器

在使用 -d 参数时，容器启动后会进入后台。此时想要进入容器，可以通过以下指令进入：

docker attach
docker exec：推荐大家使用 docker exec 命令，因为此退出容器终端，不会导致容器的停止。

4.4.1.1 exec 命令

$ docker exec -it containerID /bin/bash

4.5 导入导出容器

4.5.1 导出容器

如果要导出本地某个容器，可以使用 docker export 命令。

$ docker export 1e560fca3906 > ubuntu.tar

导出容器 1e560fca3906 快照到本地文件 ubuntu.tar

4.5.2 导入容器快照

可以使用 docker import 从容器快照文件中再导入为镜像 (Image)，以下实例将快照文件 ubuntu.tar 导入到镜像 test/ubuntu:v1

$ cat docker/ubuntu.tar | docker import - test/ubuntu:v1

此外，也可以通过指定 URL 或者某个目录来导入，例如

$ docker import http://example.com/exampleimage.tgz example/imagerepo

4.6 拷贝容器文件到本机

$ docker container cp [containID]:[/path/to/file] .

5. 制作镜像文件

5.1 保存/迁移镜像

把镜像保存为压缩包

$ docker save -o gpgpusim.tar huweim/gpgpu-sim:v2

5.2 移动镜像文件

现在镜像放在了 gpgpusim.tar 压缩包中，可以迁移到你打算使用的机器上

5.3 导入镜像

$ docker load -i gpgpusim.tar

5.4 总结 import/save 之间的差别

import: Container -> .tar, export: .tar -> Image
save: Image -> .tar, load: .tar -> Image

6. 挂载 ⭐

$ docker run -it -v /home/vsp/huweim/gpgpusim:/root/share ubuntu:20.04 /bin/bash

2022-05-30 10:52:45，使用这个选项时，会用 host 中的文件来覆盖 docker 容器中的文件

6.1 补充

host 作为 user，没有 root 权限，此时运行 docker，docker 中的 user id 需要和 host user id 一致，才可以在 docker 中修改挂载目录。

6.2 修改容器的挂载目录

方法1，停止 Docker 服务后，修改 docker 配置文件。但是在服务器上停止服务比较麻烦，采用方法2。

方法2，把容器提交为镜像，之后创建新的容器。

6.3 直接修改 docker 中挂载目录

把 docker user id 修改为和 host 一样的 user id，查看主机 user id 为 wmhu:x:2039:2039::/home/wmhu:/usr/bin/zsh

$ vim /etc/passwd

6.4 在服务器上使用 Docker 以及挂载文件夹

以 qz 服务器为例吧，2022-06-02 13:51:40，在 GPU74 结点上突然又可以用 docker 了。

6.4.1 Step1

因为是在服务器上，所以要用 sudo

$ sudo docker pull a1245967/gpgpusim
$ sudo docker run -it -v /nvme/wmhu/share_docker:/home/wmhu/share -v /home/wmhu/gpgpu-sim_distribution:/home/wmhu/gpgpu-sim_distribution --privileged=true -p 50002:22 a1245967/gpgpusim /bin/bash

至此已经创建了容器，以及相应的挂载文件夹。

6.4.1.1 插曲

连接服务器，在 /home/user 目录下创建 .vscode 目录，此时可以用 vscode 连接，在 GPU68 结点下，将 /home/user 目录下的 .vscode 目录作为 GPU68:/nvme/wmhu 目录下的软链接。如果切换到 GPU74 结点，访问 /home/user 目录下的 .vscode 目录，实际访问的是 GPU68:/nvme/wmhu 目录，而 GPU74 结点是访问不到 GPU68 结点的这个目录，因此 vscode 会连接失败，而 ssh 直接连接是可以额。

解决：登录 GPU68 结点，删除 /home/user 目录下的 .vscode 软链接。然后用 GPU74 直接登录，会在 /home/user 目录下重新下载 .vscode，此时可以登录。

6.4.2 Step2

此时进入了服务器的 Docker，在 Docker 中创建 user 并且修改 user id，和服务器上的 user id 一致

$ useradd wmhu 
$ passwd wmhu #设置密码，输入两次
$ id # 查看 user id，修改为和 host 一致的 id
uid=1129(zdli) gid=1118(group_ljw) groups=1118(group_ljw)
$ usermod -u 1129 wmhu
# qz server 上的 group 是 group_ljw，所以要手动添加 group
$ groupadd -g 1118 group_ljw
$ usermod -g group_ljw wmhu # 把 wmhu 添加到 group_ljw
# 接下来修改挂载目录的 user 和 group，原本是 root
$ chown -R wmhu:group_ljw *
$ usermod -aG sudo wmhu # 给 sudo 权限

7. 磁盘清理

2022-01-07 12:05:29，不过这次磁盘爆掉主要是因为在 Docker 中没有清理 gpgpusim log 文件

对于 Contains，长期不关闭或者清理会导致占用的内存过大

$ docker system df #查看 Docker 占用分布
$ docker system prune #对空间自动清理

自动清理范围

已停止的容器未被任何容器使用的卷未被任何容器所关联的网络所有悬空的镜像

8. 镜像上传 Push

上传前需要先登录，这里默认已经登录了

$ docker login

8.1 改名

将名字带上 docker hub 的 ID，否则无法 push，我自己是 ccoryhu

$ docker tag b356b84be90b ccoryhu/gpgpu4.0-init
$ docker push ccoryhu/gpgpu4.0-init

8.2 更改存储位置

为了防止占用太多硬盘空间，把镜像放到更大的磁盘 /home/Data 中，使用软链接的方法

$ sudo service docker stop
$ mv /var/lib/docker /home/Data/docker
$ sudo ln -s /home/Data/docker/docker /var/lib/docker #建立软链接

$ ls /var/lib/docker #确认一下类型
$ sudo service docker start #开启服务
$ docker ps -a
$ docker images #确认能够读到容器和镜像

9. 添加 docker group

Manage Docker as a non-root user:

The Docker daemon binds to a Unix socket instead of a TCP port. By default that Unix socket is owned by the user root and other users can only access it using sudo. The Docker daemon always runs as the root user.
If you don’t want to preface the docker command with sudo, create a Unix group called docker and add users to it. When the Docker daemon starts, it creates a Unix socket accessible by members of the docker group.

Docker 守护进程绑定到 Unix 套接字而不是 TCP 端口。默认情况下，Unix 套接字由用户 root 拥有，其他用户只能使用 sudo 访问它。 Docker 守护程序始终以 root 用户身份运行。
如果您不想在 docker 命令前面加上 sudo，请创建一个名为 docker 的 Unix 组并将用户添加到其中。当 Docker 守护进程启动时，它会创建一个可供 docker 组成员访问的 Unix 套接字。

9.1 Step

# Create the docker group.
$  sudo groupadd docker
# Add your user to the docker group.
$  sudo usermod -aG docker $USER
# Log out and log back in so that your group membership is re-evaluated.
# Linux use the following command
$  newgrp docker 
# Verify that you can run docker commands without sudo.
$  docker run hello-world

10. BUG

10.1

Job for docker.service failed because the control process exited with error code

启动时报错使用 sudo dockerd --debug 查看，发现错误是 failed to start daemon: error initializing graphdriver: driver not supported

10.2

Error processing tar file(exit status 1): unexpected EOF

把 .tar 文件上传到服务器上时，没有 chmod 给权限，所以报错

10.3

Docker容器里没有权限执行命令，提示Permission denied

原因是 mkdir 执行的对象是 host 和 Docker 之间的共享文件夹，docker 可能对 host 文件夹没有操作的权限，所以 Permission denied。

方法1：sudo docker exec -it -u wmhu 582c677c2c35 /bin/bash；但是在交大服务器上没有 sudo 权限，所有尝试用方法2.

方法2：创建容器实例的时候，增加参数–privileged=true；同时，还需要指定 user id。

这两个方法也许可以解决问题，但自己没有测试，因为 mwhu 这个用户不在 docker group 里面。选择的处理方式是在 Docker 中不修改挂载目录，在 host 端修改和编译即可。

Reference

https://www.ruanyifeng.com/blog/2018/02/docker-tutorial.html Docker 入门教程

https://www.runoob.com/docker/docker-container-connection.html Docker 教程