如何增加chrome-aws-lambda中铬的可用内存?

问题描述

我使用 puppeteer 和 chrome-aws-lambda 收集数据。我计划将其推送到 AWS Lambda,但在本地测试时出现错误

Error: Protocol error (Runtime.callFunctionOn): Target closed.

当我呼叫 waitForSelector 时。

我有一些帖子提到 chrome 进程可能在 docker 中获得的内存太少。问题是:如何获得更多的内存?我还读到 disable-dev-shm-usage 可能有帮助,但没有。这就是我现在的做法(最后一行是发生错误的地方):

const chromium = require('chrome-aws-lambda');
browser = await chromium.puppeteer.launch({
            args: [...chromium.args,`--proxy-server=${proxyUrl}`,'--disable-dev-shm-usage'],defaultviewport: chromium.defaultviewport,executablePath: await chromium.executablePath,headless: chromium.headless,ignoreHTTPSErrors: true,});
        const page = await browser.newPage();

        await page.authenticate({ username,password });
        await page.goto(MY_URL,{ waitUntil: 'domcontentloaded' })
        await page.click(SUBMIT_SELECTOR);
        await page.waitForSelector('#myDiv')
            .then(() => console.log('got it')).
            catch((e)=>console.log('Error happens: '+ e));

更新:关于本地设置的更多信息:

我使用 sam local start-api 在本地运行它。 这是我的 template.yaml内容(只是一个稍微更新的 hello-world 模板:

AWstemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31
Description: >
  samnode

  Sample SAM Template for samnode
  
# More info about Globals: https://github.com/awslabs/serverless-application-model/blob/master/docs/globals.rst
Globals:
  Function:
    Timeout: 60

Resources:
  
  HelloWorldFunction:
    Type: AWS::Serverless::Function # More info about Function Resource: https://github.com/awslabs/serverless-application-model/blob/master/versions/2016-10-31.md#awsserverlessfunction
    Properties:
      CodeUri: hello-world/
      Handler: app.lambdaHandler
      Runtime: nodejs14.x
      MemorySize: 4096
      Layers:
        - !Sub 'arn:aws:lambda:${AWS::Region}:764866452798:layer:chrome-aws-lambda:22'
      Events:
        HelloWorld:
          Type: Api # More info about API Event Source: https://github.com/awslabs/serverless-application-model/blob/master/versions/2016-10-31.md#api
          Properties:
            Path: /hello
            Method: get

Outputs:
  # ServerlessRestApi is an implicit API created out of Events key under Serverless::Function
  # Find out more about other implicit resources you can reference within SAM
  # https://github.com/awslabs/serverless-application-model/blob/master/docs/internals/generated_resources.rst#api
  HelloWorldApi:
    Description: "API Gateway endpoint URL for Prod stage for Hello World function"
    Value: !Sub "https://${ServerlessRestApi}.execute-api.${AWS::Region}.amazonaws.com/Prod/hello/"
  HelloWorldFunction:
    Description: "Hello World Lambda Function ARN"
    Value: !GetAtt HelloWorldFunction.Arn
  HelloWorldFunctionIamRole:
    Description: "Implicit IAM Role created for Hello World function"
    Value: !GetAtt HelloWorldFunctionRole.Arn

解决方法

  MemorySize: 4096

您已经为 Lambda 配置了 4GB 内存,它应该足以加载几个页面。如果你仍然觉得是这个问题,你可以将内存增加到10240。我怀疑这个错误可能与内存无关。

要验证,您可以执行以下操作以查看 Lambda 是否确实获取了指定的内存。

在 Eager 模式下运行 lambda(即使没有活动请求,这也会使 lambda 在本地运行)

sam local start-api --warm-containers EAGER

现在运行以下命令来跟踪内存消耗

docker stats

您现在可以向本地 api 发送请求并跟踪内存消耗。 如果您看到分配给 lambda 函数的内存少于 4GB,请更新 Docker 资源并确保为 Docker 分配适当的内存。

更新 Docker 资源(增加内存)

尝试不同版本的 chrome-aws-lambda(可能会使用 local layer with SAM)。 我还将通过禁用无头模式并验证代码正在等待的选择器实际可用,使用 Puppeteer 在本地运行相同的代码块。

  • 安装 puppeteer 依赖项。
  • 更新代码以使用 puppeteer 而不是 chrome-aws-lambda

const puppeteer = require('puppeteer');

  • 禁用无头模式

browser = await puppeteer.launch({headless: false});

  • 现在使用 node <replace-with-your-file-name.js> 运行文件,例如如果文件名是 somejsfile.js 那么命令应该是 node somefile.js

希望这能帮助您继续前进。