linux – 主要网站需要哪些硬件和软件才能正确管理1000台服务器?

对不起这么高级别的问题.我理解服务器负载平衡的基础知识,但管理30,000台服务器的概念对我来说有点陌生.是否真的只是平衡2或3台服务器的概念,扩展了10,000倍?

这与memcached,sql / mysql,搜索引擎等有什么关系?

它是一个层次系统,让“控制器”服务器和从属服务器基于此提供数据吗?如何处理冗余?

感谢有关此事的文章的任何信息或指示.

编辑感谢回复家伙.我的帖子已经关闭了,但我已经修改了标题,希望它会重新打开,因为我发现这些超高级数据解决方案涉及的问题解决过程很有吸引力,而且我目前正在构建一个需要一些基本负载的api平衡,因此问题.

解决方法

Google在其服务器上使用的大多数软件堆栈都是内部开发的.为了减轻不可避免的硬件故障的影响,软件被设计为容错的.

资料来源:Google Platform

在阅读完文章之后,我猜测它是通过使用Linux内部开发的内部软件堆栈来平衡几台服务器之间的负载相同的概念,这些服务器可扩展到1000台服务器.例如GFS(谷歌文件系统),BigTable – 基于GFS构建的结构化存储系统

This链接描述了它们如何平衡网络负载.

他们使用负载平衡开关来分配负载.对网站的所有请求都到达一台机器,然后该机器将请求传递给其中一个可用服务器.交换机可以从服务器中找出哪个负载最少,因此所有这些都在进行相同的工作.

Google’s Network Topology如下:

当客户端计算机尝试连接到Google时,多个DNS服务器会通过循环策略将www.google.com解析为多个IP地址.此外,这可以作为第一级负载平衡,并将客户端定向到不同的Google群集. Google群集有数千台服务器,一旦客户端连接到服务器,就会进行额外的负载平衡,以便将查询发送到负载最少的Web服务器.

相关文章

linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、...
Linux性能观测工具按类别可分为系统级别和进程级别,系统级别...
本文详细介绍了curl命令基础和高级用法,包括跳过https的证书...
本文包含作者工作中常用到的一些命令,用于诊断网络、磁盘占满...
linux的平均负载表示运行态和就绪态及不可中断状态(正在io)的...
CPU上下文频繁切换会导致系统性能下降,切换分为进程切换、线...