分析Mysql 5.6的Dockerfile

Docker官方的Mysql镜像的Dockerfile托管在Github上，地址如下：

https://github.com/docker-library/mysql/tree/5836bc9af9deb67b68c32bebad09a0f7513da36e/5.6

仔细研究了一下其Dockerfile，发现最有技术含量的倒不是其Dockerfile本身，无非是更新软件仓库，下载Mysql Server，稍微修改一下其配置文件。

倒是ENTRYPOINT对应的docker-entrypoint.sh很耐人寻味，这个文件相当详实，涉及了Mysql如何初始化，如何设置密码，如何启动服务等关键问题。

今天花费了大半天来分析这个脚本，果然是受益匪浅。

脚本及分析结果如下：

#!/bin/bash
set -e

# if command starts with an option,prepend mysqld
if [ "${1:0:1}" = '-' ]; then
    set -- mysqld "$@"
fi

 "$1" = 'mysqld' then
    # Get config
    DATADIR="$("$@" verbose --help 2>/dev/null | awk '$1 == "datadir" { print $2; exit }')"

     ! -d "$DATADIR/mysql" then
         -z "$MYSQL_ROOT_PASSWORD" -a -z "$MYSQL_ALLOW_EMPTY_PASSWORD" 
            echo >&2 'error: database is uninitialized and MYSQL_ROOT_PASSWORD not set'  Did you forget to add -e MYSQL_ROOT_PASSWORD=... ?'
            exit 1
        fi

        mkdir p "$DATADIR"
        chown R mysql:mysql "$DATADIR"

        echo Running mysql_install_db
        mysql_install_db user=mysql --datadir="$DATADIR" --rpm --keep-my-cnf
        echo Finished mysql_install_db

        mysqld user=mysql --datadir="$DATADIR" --skip-networking &
        pid="$!"

        mysql=( mysql protocol=socket -uroot )

        for i in {30..0}; do
            if echo SELECT 1' | "${mysql@]}" &> /devnull; then
                break
            fi
            echo MySQL init process in progress...
            sleep 
        done
         "$i" = 0 MySQL init process failed.
        fi

        # sed is for https://bugs.mysql.com/bug.php?id=20545
        mysql_tzinfo_to_sql /usr/share/zoneinfo | sed s/Local time zone must be set--see zic manual page/FCTY/]}" mysql

        "${mysql<<-EOSQL
             What's done in this file shouldn't be replicated
              or products like mysql-fabric won't work
            SET @@SESSION.SQL_LOG_BIN;
            DELETE FROM mysql.user ;
            CREATE USER root'@%' IDENTIFIED BY ${MYSQL_ROOT_PASSWORD}GRANT ALL ON *.* TO ' WITH GRANT OPTIONDROP DATABASE IF EXISTS test ;
            FLUSH PRIVILEGES ;
        EOSQL

         ! -z "$MYSQL_ROOT_PASSWORD" 
            mysql+=( p"${MYSQL_ROOT_PASSWORD}" )
        fi

         "$MYSQL_DATABASE" 
            echo "CREATE NOT EXISTS \`$MYSQL_DATABASE\` ;" }"
            mysql+=( "$MYSQL_DATABASE" )
        fi

         "$MYSQL_USER" -a "$MYSQL_PASSWORD" "$MYSQL_USER""$MYSQL_PASSWORD"' ;" }"

            
                echo "ON \`"$MYSQL_DATABASE"\`.}"
            fi

            echo FLUSH PRIVILEGES ;}"
        fi

        echo
        for f in /docker-entrypoint-initdb.d/*; do
            case "$f" in
                *.sh)  echo "$0: running $f"; . "$f" ;;
                *.sql) echo "$0: running $f"; "${mysql[@]}" < "$f" && echo ;;
                *)     echo "$0: ignoring $f" ;;
            esac
            echo
        done

        if ! kill -s TERM "$pid" || ! wait "$pid"; then
            echo >&2 'MySQL init process failed.'
            exit 1
        fi

        echo
        echo 'MySQL init process done. Ready for start up.'
        echo
    fi

    chown -R mysql:mysql "$DATADIR"
fi

exec "$@"

说明如下：

1> set -e,Manual文档的说明如下：

Exit immediately if a pipeline (which may consist of a single simple command),a subshell com‐
mand enclosed in parentheses,or one of the commands executed as part of a command list
enclosed by braces (see SHELL GRAMMAR above) exits with a non-zero status.

这句语句告诉bash如果任何语句的执行结果不是true则应该退出。这样的好处是防止错误像滚雪球般变大导致一个致命的错误，而这些错误本应该在之前就被处理掉。

关于set -e的利弊，可参考一下两篇博客

（1）Unix/Linux 脚本中 “set -e” 的作用

（2）linux中的set命令: "set -e" 与 "set -o pipefail"

if [ "${1:0:1}" = '-' ]; 
    set -- mysqld $@"
fi

用于判断该脚本后面的参数是否以“-”开始，它考虑的是启动mysqld是带参数的情况，如果有的话，就将mysqld和参数作为变量存到$@中。

关于set --，Manual文档的说明如下：

If no arguments follow this option,then the positional parameters are unset. Otherwise,the
positional parameters are set to the args,even if some of them begin with a -.

验证如下：

首先构造脚本

root@localhost ~]# cat 4.sh 
#!fi
echo $@: "$@"
echo $1: '"$1"

加入参数进行验证

]# sh 4.sh 123
$@: 
$1: 123

$@: mysqld : mysqld
123 4561: mysqld

补充一点：关于$@与$*的区别，$@指每个位置参数参数都是一个独立的""引用字串,这就意味着参数被完整地传递，而$*则指所有位置参数只被一个""引用，相当于一个参数。

then

如果$1为mysqld，则执行下面的代码，如果不是，则执行该脚本最后一行的exec "$@"。

注意：Dockerfile中的CMD命令为 ["mysqld"]，CMD命令其实就是ENTRYPOINT的参数，譬如如果ENTRYPOINT命令为ls，则CMD命令为-l，则实现的效果就是ls -l，

在启动容器时，自己输入的命令其实是覆盖CMD参数的，具体在本例中，就意味着在启动容器时，自已输入的命令只有在三种情况下才会启动mysqld服务：一、mysqld（相当于CMD参数）。二、以“-”开始的参数列表，这样上述2中的脚本才会判断为真。三、mysqld + 以“-”开始的参数列表。除此之外，其它所有的命令都不会启动mysql server服务，而是直接执行自己输入的命令。

 DATADIRverbose --help 2>/dev/null | awk '$1 == "datadir" { print $2; exit }')"

获取mysql server的数据目录,倘若我们没有输入任何以“-”开始的参数列表，则$@为mysqld，上述命令执行的结果如下：

]# mysqld verbose --help 2>/dev/null | awk '$1 == "datadir" { print $2; exit }'
/var/lib/mysql/

 then

如果存在/var/lib/mysql/mysql目录存在文件，则跳过中间的步骤，直接执行chown -R mysql:mysql "$DATADIR"，它这里判断的一个依据是，如果/var/lib/mysql/mysql存在文件，则代表mysql server已经安装，这时就无需安装（当然，如果强行安装的话，可能会覆盖），直接将其属主修改为mysql用户。很多童鞋可能好奇，不是新建的镜像么？这个目录怎么可能存在呢？我当初也存在这样的疑惑，后来验证了一番，发现如果将宿主机的目录直接挂载到镜像的/var/lib/mysql下，则启动mysql镜像时，没有进行mysql的初始化，设置root密码等，直接启动mysql服务，具体如下：

]# docker run -v /mysql:mysql mysql
20150924 02:08:05 0 Note] mysqld (mysqld 5.6.26) starting as process  ...
1 ] Plugin FEDERATEDis disabled.
] InnoDB: Using atomics to ref count buffer pool pages
] InnoDB: The InnoDB memory heap  disabled
] InnoDB: Mutexes and rw_locks use GCC atomic builtins
] InnoDB: Memory barrier is not used
] InnoDB: Compressed tables use zlib 1.2.7
 InnoDB: Using Linux native AIO
 InnoDB: Using CPU crc32 instructions
] InnoDB: Initializing buffer pool,size = 128.0M
] InnoDB: Completed initialization of buffer pool
] InnoDB: Highest supported file format  Barracuda.
06 ] InnoDB: 128 rollback segment(s) are active.
] InnoDB: Waiting for purge to start
26 started; log sequence number 1697388
] Server hostname (bind-address): *'; port: 3306
] IPv6  available.
]   - ::' resolves to ;
] Server socket created on IP: .
Warning] user' entry root@localhost.localdomain' ignored in skip-name-resolve mode.
@localhost.localdomainproxies_priv@ root@localhost.localdomain] Event Scheduler: Loaded  events
] mysqld: ready for connections.
Version: 5.6.26'  socket: /var/run/mysqld/mysqld.sock'  port: 3306  MySQL Community Server (GPL)

而先前的启动过程则涉及到初始化，启动，显性设置root密码等。

将宿主机的var/lib/mysql/挂载给容器后，我们再来看看宿主机上该目录的权限。

]# ll 
total 110604
-rw-rw-- 1 polkitd ssh_keys       56 Sep 14 15:46 auto.cnf
drwx---- 2 polkitd ssh_keys      131 Sep 14 16:03 db1
drwx---- 2 polkitd ssh_keys      131 Sep 14 16:03 db2
drwx---- 2 polkitd ssh_keys       55 Sep 14 16:02 db3
-- 1 polkitd ssh_keys 12582912 Sep 24 10:08 ibdata1
-- 1 polkitd ssh_keys 50331648 Sep 24 10:08 ib_logfile0
-- 1 polkitd ssh_keys 50331648 Sep 14 15:45 ib_logfile1
drwx---- 2 polkitd ssh_keys     4096 Sep 23 14:18 mysql
drwx---- 2 polkitd ssh_keys     4096 Sep 22 13:47 performance_schema

属主为polkitd，属组为ssh_keys。

此时，需显性将/var/lib/mysql的属主和属组恢复为mysql，即chown -R mysql:mysql /var/lib/mysql/，不然，宿主机的mysql服务将无法启动。

fi

设置mysql的root账户的密码，其中-z判断是否为空字符串，-a 两个条件同时满足，才为true。从这里也可以看出来，随意给MYSQL_ALLOW_EMPTY_PASSWORD赋一个值，都可以实现无密码登录。

        mkdir ="$!"

创建/var/lib/mysql，同时将其属主和属组设置为mysql，然后初始化数据库，最后用mysqld命令启动数据库。$!指的是Shell最后运行的后台Process的PID。

        mysql
        fi

这段代码主要是利用mysql客户端测试mysql服务是否启动。这里面利用括号()构造mysql变量的方式挺有意思的，以前没有见过。特意验证了一下：

]# mysqlprotocol=socket -uroot )
# echo ${mysql}
mysql
]# echo ${mysql}
mysql protocol=socket -uroot

这段代码给了30s的时间来判断mysql服务是否已启动，如果启动了，则退出循环，如果没有启动，循环结束后，变量i的值为0，通过后续的if语句，屏幕输出“MySQL init process failed”。

这里判断mysql服务是否启动的方式蛮有意思的，

]# echo }" 
1
1
# mysql
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id 11
Server version: 26 MySQL Community Server (GPL)
mysql> select +-+
| 1 |
1 row set (0.01 sec)

如果停掉了mysql服务，则输出如下：

# systemctl stop mysqld
}" 
ERROR 2002 (HY000): Cant connect to local MySQL server through socket /mysql.sock (2)

在这里，还有一点很让人疑惑，

fi

if判断的条件难道不是echo 'SELECT 1' | "${mysql[@]}"命令的返回码么？如果是这样的话，成功执行，则$?为0，此时不应该执行break语句的，但事实与推测的相反。关于这点暂且留下。

mysql_tzinfo_to_sql ]}" mysql

修改mysql关于时区的一个bug,不去深究。

10>

       "${mysql ;
        EOSQL

这段主要是用客户端登录数据库进行相关操作，包括修改root密码，为其授权，删除测试数据库等。SET @@SESSION.SQL_LOG_BIN=0的作用是停止使用日志文件，这点不是很明白。

11>

        }"
        fi

这段代码主要是创建数据库，新建mysql用户，并授权。这其实意味着用户在启动容器时可以通过指定MYSQL_DATABASE参数来创建数据库，通过MYSQL_USER和MYSQL_PASSWORD来创建新的数据库用户。

其中，mysql+=( -p"${MYSQL_ROOT_PASSWORD}" )用于拼接变量。譬如：

]# MYSQL_DATABASEdocker
( "$MYSQL_DATABASE" )
protocol=socket -uroot docker

12>

       for f ; do
            case "$f" in
                *.sh)  echo "$0: running $f"; . "$f" ;;
                *.sql) echo "$0: running $f"; "${mysql[@]}" < "$f" && echo ;;
                *)     echo "$0: ignoring $f" ;;
            esac
            echo
        done

其它需要执行的shell脚本或者sql脚本，可放到/docker-entrypoint-initdb.d/目录下。只需启动容器时，通过-v参数将容器该目录挂载到宿主机目录上。

13>

        if ! kill -s TERM "$pid" || ! wait "$pid"; 
        fi

关闭已启动的mysql server，可能很多人会感到好奇，不是提供mysql服务么？为什么还要关闭呢？

答案就在于dockerfile中CMD的命令为 ["mysqld"]，如果不关闭的话，这里就无法启动。

这里比较有意思的还是在于脚本部分，

一、关于kill，kill命令是通过向进程发送指定的信号来结束进程的。

-s的意思是Specify the signal to send. The signal may be given as a signal name or number.指定需要发送的信号.

如果没有指定发送信号，那么默认值为TERM信号。

关于-TERM和-9的区别

kill -TERM PID：TERM是请求彻底终止某项执行操作.它期望接收进程清除自给的状态并退出，它是一种较温和的方式。

kill -9 PID：

这个强大和危险的命令迫使进程在运行时突然终止，进程在结束后不能自我清理。危害是导致系统资源无法正常释放，一般不推荐使用，除非其他办法都无效。
当使用此命令时，一定要通过ps -ef确认没有剩下任何僵尸进程。只能通过终止父进程来消除僵尸进程。如果僵尸进程被init收养，问题就比较严重了。杀死init进程意味着关闭系统。
如果系统中有僵尸进程，并且其父进程是init，而且僵尸进程占用了大量的系统资源，那么就需要在某个时候重启机器以清除进程表

二、关于||运算符

关于&&和||的区别

command1 && command2 ：左边的命令（命令1）返回真(即返回0，成功被执行）后，&&右边的命令（命令2）才能够被执行。

command1 || command2：左边的命令（命令1）执行失败了，就执行右边的命令（命令2）。

三、关于wait

wait命令用来等待指令的完成，直到其执行完毕后返回终端。

所以这段脚本的逻辑是首先用kill -s TERM "$pid"的方式关闭mysqld进程，如果执行成功了，则! kill -s TERM "$pid"的结果为false，这时候就执行wait "$pid"，wait是等待mysqld的关闭，mysqld关闭完毕后，wait "$pid"结果为真，此时! wait "$pid"结果为假。echo语句就不执行。

至此，分析完毕~

分析Mysql 5.6的Dockerfile

相关文章