问题描述
我有一些使用flask 运行python 3.7 的服务,并且只需要一些额外的库。其中之一是能够连接到 postgres 的 psycopg2。
就其本身而言,在 alpine 中安装 psycopg2 并不是一项非常艰巨的任务,但我在查找有关此事的文档时遇到了一些问题。我设法获得了运行正常的 dockerfile。最大的缺点是它大约 355MB,而且太重了。
这是我在任何优化之前的初始 dockerfile:
FROM python:3.7-alpine
ENV PATH /usr/local/bin:$PATH
ENV LANG C.UTF-8
RUN mkdir -p /usr/src/app
copY requirements.txt /usr/src/app/
RUN apk update \
&& apk add postgresql-dev \
&& apk add --virtual temp1 gcc python3-dev musl-dev \
&& pip install --upgrade pip \
&& pip install psycopg2==2.8.4
RUN pip install -r /usr/src/app/requirements.txt
RUN apk del temp1
copY . /usr/src/app
workdir /usr/src/app
EXPOSE 6000
ENTRYPOINT ["python3"]
CMD ["-m","server"]
还有我的requirements.txt
psycopg2 == 2.8.4
connexion == 1.1.15
python_dateutil == 2.6.0
loguru~=0.4.1
flask~=1.1.2
six~=1.14.0
Werkzeug==0.16.1
pymongo
PyYAML == 5.3
setuptools == 45.1.0
flask_testing == 0.7.1
mo-future>=3
pyparsing==2.3.1
mo_files
pycryptodomex
ldap3
做了一些测试,我发现增加图像大小最多的步骤是:
我试图做的事情来减小它的大小:
- 安装 postgresql-dev 作为构建依赖项,并在构建 psycopg2 后将其从映像中删除。删除 postgresql-dev 会引发错误,其中找不到文件 libpq.so.5。
- 删除升级 pip 语句。它不需要工作,但我想保持最新
我将尝试回答这些问题:
解决方法
减少 psycopg2 安装大小
我想做的第一件事是从容器中删除 postgresql-dev 并且仍然能够使用 psycopg2。唯一似乎丢失的文件是 libpq.so.5。此文件在 alpine 包 libpq available here 中可用。
通过这种方式,我们可以构建 psycopg2 并且仍然几乎节省了它之前使用的所有空间。
提高dockerfile的step效率
我尝试尽量减少 dockerfile 中的步骤数,以便最终图像更亮。向 pip 和 apk 添加适当的标志,我们可以减少用于缓存的空间量。此外,声明一个用于对所有构建依赖项进行分组的变量可以使事情更清晰。
我还定义了一个更仔细编写的 .dockerignore 以节省更多空间。使用 tree 之类的工具可以帮助您找到容器中不需要的文件。
添加基本安全
基于 this fine article,我能够为我的容器指定一个不能修改容器的用户。
最终版本
这是我最终得到的 dockerfile。它从 355MB 减少到 135MB,虽然不是很完美,但好多了。
FROM python:3.7-alpine
ENV PATH /usr/local/bin:$PATH
ENV LANG C.UTF-8
ENV USER=prodUser UID=12345 GID=23456
RUN mkdir -p /usr/src/app
COPY requirements.txt /usr/src/app/
RUN buildDeps='gcc python3-dev musl-dev postgresql-dev' \
&& apk update \
&& apk add --no-cache libpq \
&& apk add --virtual temp1 --no-cache $buildDeps \
&& pip install --no-cache-dir -r /usr/src/app/requirements.txt \
&& apk del temp1
COPY . /usr/src/app
WORKDIR /usr/src/app
RUN addgroup --gid "$GID" "$USER" \
&& adduser \
--disabled-password \
--gecos "" \
--ingroup "$USER" \
--uid "$UID" \
"$USER"
USER $USER
EXPOSE 6000
ENTRYPOINT ["python3"]
CMD ["-m","server"]
后续步骤
- 正如前面提到的文章所暗示的,我将针对生产目的对 gunicorn 和 gnix 进行一些研究。
- 我将对 requirements.txt 文件安装的推荐包进行一些测试,并尝试删除我不需要的包。
- 我可以尝试进一步减少 dockerfile 中定义的步骤数
最后的笔记
我对 docker 工作还很陌生,所以欢迎您提出任何建议或更改!