问题描述
我有一个用于在 AI 平台上进行在线预测的端点(统一) 并且只能找到 severity >= ERROR 的日志..
模型部署使用:--enable-container-logging
容器内的记录器代码:
module_logger = logging.getLogger("MODULE_NAME")
module_logger.setLevel(logging.INFO)
handler = logging.StreamHandler()
handler.setFormatter("%(asctime)s — %(name)s — %(levelname)s — %(funcName)s:%(lineno)d — " "%(message)s")
module_logger.addHandler(handler)
查询: resource.type="aiplatform.googleapis.com/Endpoint" resource.labels.endpoint_id="ENDPOINT_ID" resource.labels.location="us-central1"
两个问题:
-
我们如何确保容器记录的所有日志都被记录下来并在日志查看器中看到?
-
严重程度如何?控制台/平台是如何推导出来的?
解决方法
回答我自己:
- Container logs that are logged to stdout or stderr are captured by the gcloud logger
- 似乎没有明确的文档,但似乎
stderr
日志被解释为具有严重性ERROR
而标准输出为INFO