执行负载测试以模拟 200k - 500k 并发用户的最佳解决方案是什么?

问题描述

我正在寻找执行负载测试的最佳解决方案,以模拟 200k - 500k 并发用户来测试 Web 应用程序。一些场景与视频查看、用户内容推送(如图片、视频上传)、页面查看有关。目标之一就是确保 CDN 服务能够从用户的角度处理如此巨大的负载

从研究来看,Jmeter 似乎可以按照此处的描述进行分发:

问题:

  1. 但是,在寻找云时如何估计需要多少个从节点以及使用哪些硬件?

  2. BlazeMeter 服务怎么样?看起来这项服务可以节省时间 - 只需避免基础设施设置。

实际上,如果不回答问题 1,就无法计算成本并进行比较。

有什么建议吗?使用最佳智能解决方案在严格的时间范围内进行目标测试的想法:)

解决方法

Docker 本身并没有解决扩展挑战,它做了相反的事情:产生消耗资源的开销。因此,除非您拥有像 Docker SwarmK8S 这样的容器编排解决方案,可以在物理机或虚拟机上自动扩展或创建新容器 - 与 running JMeter in distributed mode 相比,它不会为您带来任何性能优势在不使用容器的裸机或虚拟机上。

  1. 没有“c6g.large AWS instance 可以模拟 5000 个虚拟用户”之类的答案,因为实际数量取决于:

    • 机器硬件规格
    • 测试的性质(采样器、前/后处理器、断言等的性质)
    • 应用响应时间和大小

    因此,如果您执行返回少量数据的简单 HTTP GET requests,与上传大文件和接收大量响应的情况相比,您将能够模拟更多用户

    所以你应该这样做:

    • 确保有一个解决方案来监控 JMeter 引擎在 CPU、RAM、网络、磁盘 IO 等方面的健康状况。如果你没有一个想法,你可以考虑使用 { {3}}

    • 请务必关注JMeter PerfMon Plugin

    • 从 1 个虚拟用户开始,在查看资源消耗的同时逐渐增加负载

    • 当任何受监控的资源消耗开始超过合理阈值时,即总可用容量的 80% - 通过查看 JMeter Best Practices

    • 这是您可以在特定此机器上针对特定此测试模拟的用户数量

  2. BlazeMeter 引擎的硬件容量也受到限制,并且上述限制适用,因此请确保在负载测试期间监控 Active Threads Over Time listener,就像 JMeter 无法足够快地发送请求一样,您会得到“假阴性”即使您的应用程序每单位时间可以处理更多请求,也会产生结果