带有 psycopg2

问题描述

我有一些使用flask 运行python 3.7 的服务,并且只需要一些额外的库。其中之一是能够连接到 postgres 的 psycopg2。

就其本身而言,在 alpine 中安装 psycopg2 并不是一项非常艰巨的任务,但我在查找有关此事的文档时遇到了一些问题。我设法获得了运行正常的 dockerfile。最大的缺点是它大约 355MB,而且太重了。

这是我在任何优化之前的初始 dockerfile:

FROM python:3.7-alpine

ENV PATH /usr/local/bin:$PATH

ENV LANG C.UTF-8

RUN mkdir -p /usr/src/app

copY requirements.txt /usr/src/app/

RUN apk update \
    && apk add postgresql-dev \
    && apk add --virtual temp1 gcc python3-dev musl-dev \
    && pip install --upgrade pip \
    && pip install psycopg2==2.8.4

RUN pip install -r /usr/src/app/requirements.txt

RUN apk del temp1

copY . /usr/src/app

workdir /usr/src/app

EXPOSE 6000

ENTRYPOINT ["python3"]

CMD ["-m","server"]

还有我的requirements.txt

psycopg2 == 2.8.4
connexion == 1.1.15
python_dateutil == 2.6.0
loguru~=0.4.1
flask~=1.1.2
six~=1.14.0
Werkzeug==0.16.1
pymongo
PyYAML == 5.3
setuptools == 45.1.0
flask_testing == 0.7.1
mo-future>=3
pyparsing==2.3.1
mo_files
pycryptodomex
ldap3

做了一些测试,我发现增加图像大小最多的步骤是:

  • 安装 psycopg2 和 postgresql-dev:220MB 只被这两个使用
  • 安装要求:最多 60MB
  • 升级 pip:为最终图像增加 15MB

我试图做的事情来减小它的大小:

  • 安装 postgresql-dev 作为构建依赖项,并在构建 psycopg2 后将其从映像中删除删除 postgresql-dev 会引发错误,其中找不到文件 libpq.so.5。
  • 删除升级 pip 语句。它不需要工作,但我想保持最新

我将尝试回答这些问题:

  • 首先如何在不浪费太多空间的情况下安装 psycopg2
  • 关于容器的空间减少和安全性,我应该应用到我的 dockerfile 的任何最佳实践

解决方法

减少 psycopg2 安装大小

我想做的第一件事是从容器中删除 postgresql-dev 并且仍然能够使用 psycopg2。唯一似乎丢失的文件是 libpq.so.5。此文件在 alpine 包 libpq available here 中可用。

通过这种方式,我们可以构建 psycopg2 并且仍然几乎节省了它之前使用的所有空间。

提高dockerfile的step效率

我尝试尽量减少 dockerfile 中的步骤数,以便最终图像更亮。向 pip 和 apk 添加适当的标志,我们可以减少用于缓存的空间量。此外,声明一个用于对所有构建依赖项进行分组的变量可以使事情更清晰。

我还定义了一个更仔细编写的 .dockerignore 以节省更多空间。使用 tree 之类的工具可以帮助您找到容器中不需要的文件。

添加基本安全

基于 this fine article,我能够为我的容器指定一个不能修改容器的用户。

最终版本

这是我最终得到的 dockerfile。它从 355MB 减少到 135MB,虽然不是很完美,但好多了。

FROM python:3.7-alpine

ENV PATH /usr/local/bin:$PATH
ENV LANG C.UTF-8
ENV USER=prodUser UID=12345 GID=23456

RUN mkdir -p /usr/src/app

COPY requirements.txt /usr/src/app/

RUN buildDeps='gcc python3-dev musl-dev postgresql-dev' \
    && apk update \
    && apk add --no-cache libpq \
    && apk add --virtual temp1 --no-cache $buildDeps \
    && pip install --no-cache-dir -r /usr/src/app/requirements.txt \
    && apk del temp1

COPY . /usr/src/app

WORKDIR /usr/src/app

RUN addgroup --gid "$GID" "$USER" \
  && adduser \
  --disabled-password \
  --gecos "" \
  --ingroup "$USER" \
  --uid "$UID" \
  "$USER"
USER $USER

EXPOSE 6000

ENTRYPOINT ["python3"]

CMD ["-m","server"]

后续步骤

  • 正如前面提到的文章所暗示的,我将针对生产目的对 gunicorn 和 gnix 进行一些研究。
  • 我将对 requirements.txt 文件安装的推荐包进行一些测试,并尝试删除我不需要的包。
  • 我可以尝试进一步减少 dockerfile 中定义的步骤数

最后的笔记

我对 docker 工作还很陌生,所以欢迎您提出任何建议或更改!