COW机制
Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
什么是存储卷
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
[root@localhost ~]# docker run -it --rm busybox
/ #
/ # ls
bin dev etc home proc root sys tmp usr var
/ # touch abc
/ # ls
abc bin dev etc home proc root sys tmp usr var
//另打开一个终端查看
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
57a59b6ce8d4 busybox "sh" 3 seconds ago Up 3 seconds crazy_lumiere
[root@localhost ~]# df -h
文件系统 容量 已用 可用 已用% 挂载点
devtmpfs 875M 0 875M 0% /dev
tmpfs 895M 0 895M 0% /dev/shm
tmpfs 895M 8.8M 886M 1% /run
tmpfs 895M 0 895M 0% /sys/fs/cgroup
/dev/mapper/cs-root 66G 2.5G 63G 4% /
/dev/sda1 1014M 195M 820M 20% /boot
/dev/mapper/cs-home 32G 260M 32G 1% /home
tmpfs 179M 0 179M 0% /run/user/0
overlay 66G 2.5G 63G 4% /var/lib/docker/overlay2/d7abd2c68981c8ce3ff4d895a164705dddf077bf896c92bd72dc5d6779ed8118/merged
[root@localhost ~]# cd /var/lib/docker/overlay2/d7abd2c68981c8ce3ff4d895a164705dddf077bf896c92bd72dc5d6779ed8118/merged
[root@localhost merged]# ls
abc bin dev etc home proc root sys tmp usr var
联合挂载:
AUFS
Overlay
Devicemapper
VFS
btrfs
先挂载再做关联
先关联后挂载:
[root@localhost ~]# ls /mnt/
hgfs
[root@localhost ~]# touch /mnt/wxy
[root@localhost ~]# ls /mnt/
hgfs wxy
// 挂载
[root@localhost ~]# mount /dev/cdrom /mnt
mount: /mnt: WARNING: device write-protected, mounted read-only.
//查看发现wxy文件被隐藏
[root@localhost ~]# ls /mnt/
AppStream BaseOS EFI images isolinux LICENSE media.repo TRANS.TBL
//取消挂载
[root@localhost ~]# umount /mnt
[root@localhost ~]# ls /mnt/
hgfs wxy
使用存储卷的好处
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
为什么要用存储卷
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
[root@localhost ~]# docker run -it --name yaya busybox
/ # ls
bin dev etc home proc root sys tmp usr var
/ # mkdir /data
/ # ls
bin data dev etc home proc root sys tmp usr var
/ # echo 'hello yaya' > data/index.html
/ # cat data/index.html
hello yaya
//新开终端查看
[root@localhost ~]# df -h
文件系统 容量 已用 可用 已用% 挂载点
devtmpfs 875M 0 875M 0% /dev
tmpfs 895M 0 895M 0% /dev/shm
tmpfs 895M 8.8M 886M 1% /run
tmpfs 895M 0 895M 0% /sys/fs/cgroup
/dev/mapper/cs-root 66G 2.5G 63G 4% /
/dev/sda1 1014M 195M 820M 20% /boot
/dev/mapper/cs-home 32G 260M 32G 1% /home
tmpfs 179M 0 179M 0% /run/user/0
overlay 66G 2.5G 63G 4% /var/lib/docker/overlay2/65b28af1ee70c4ae8b7792089cef2cfcf2370ef86831b3599f22df86b0ab7630/merged
[root@localhost ~]# cd /var/lib/docker/overlay2/65b28af1ee70c4ae8b7792089cef2cfcf2370ef86831b3599f22df86b0ab7630/merged
[root@localhost merged]# ls
bin data dev etc home proc root sys tmp usr var
//退出容器
/ # exit
[root@localhost ~]#
[root@localhost ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
c648d0ddc8c3 busybox "sh" 2 minutes ago Exited (0) 35 seconds ago yaya
//退出容器后数据仍在
[root@localhost merged]# ls
bin data dev etc home proc root sys tmp usr var
//删除容器
[root@localhost ~]# docker rm yaya
yaya
//数据丢失
[root@localhost