手写 WEB 服务器和 HTTP 协议

手写 WEB 服务器和 HTTP 协议

本节我们将借助 Socket 实现服务的端口监听并根据 Http 协议的请求和响应结构,实现一个简单的 Web 服务器,加深体验 Web 服务和 Http 协议的原理。

1. Http服务基本要素

1.1 监听连接

浏览器每发起一次请求都需要跟服务端建立连接,服务端要时刻监听有没有客户端连接。传输层协议有 TCP/UDP 两种,实现起来并没有强制说用哪一种,下面是官方文档对 Http 连接的说明:

HTTP communication usually takes place over TCP/IP connections. The default port is TCP 80 .

文档中指明了连接通常用的是 TCP, TCP 不用考虑数据包乱序,丢失这些问题,实现起来更简单,高效。在代码层我们可以用 Socket 来实现我们的 TCP 传输服务。

1.2 接收数据

Socket 监听连接,在没有连接到来之前一直是阻塞在 serverSocket.accept(); 有请求过来就可以运行到下面的代码,然后可以根据我们的输入流读取信息,根据 Http 协议拆开获取我们要的请求数据。

1.3 返回数据

根据业务处理完获得返回实体数据,然后遵从 Http 协议格式构造返回的消息报文。浏览器获得到的数据也会根据 Http 协议进行渲染。

2. Http报文格式

Http 协议请求报文的本质就是一堆字符串,只是这堆字符是有格式的,发送方跟接收方都需要按照这个格式来拼接和拆解内容。我们要实现一个 Web 服务,了解这个是最基本的要素。

以下截图的报文是通过 tcpflow(一款功能强大的、基于命令行的免费开源工具)在 Linux 系统抓包获取的。

sudo tcpflow -c port 8080

2.1 Request

http-request

request

图中各种请求首部字段的具体含义/用途,会在下面章节中详细讲解到。

2.2 Response

一般情况下,服务器收到客户端的请求后,就会有一个 Http 的响应消息,Http 响应也由 4 部分组成,分别是:状态行、响应头、空行 和 响应实体。

response

图中的首部字段和返回内容(响应实体)中间是有一个空行的。

3. 实现

3.1 效果

demo

  • Web 服务端监听 8090 端口;
  • 本地浏览器访问 8090 页面显示 hello tomcat

3.2 代码

package com.imooc.mytomcat.tomcat;

import java.io.IOException;
import java.io.OutputStream;
import java.net.ServerSocket;
import java.net.Socket;

/**
 * Mytomcat
 *
 * @author zhourj
 * description
 */
public class Mytomcat {
    public static void main(String[] args) {
        Mytomcat server = new Mytomcat();
        server.start();
    }
    private void start(){
        try {
            //开启一个 Socket 服务端,并监听 8090 端口
            ServerSocket serverSocket = new ServerSocket();
            do {
                //阻塞,直到有客户端连接上,才会执行后面的逻辑
                Socket socket = serverSocket.accept();
                //处理数据
                hander(socket);
            } while (true);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * http response
     *  第一行 协议 返回状态
     *  第二行 媒体类型 josn/html
     *  第三行 空
     *  内容
     * @param socket
     */
    private void hander(Socket socket) throws IOException {
        //拼接返回的 request 报文
        StringBuilder responseBuilder = new StringBuilder();
        responseBuilder
		        //返回 200 状态码,表示请求成功
		        .append("HTTP/1.1 200 \r\n")
		        //告诉请求的客户端,返回的内容是 text/html 格式的
                .append("Content-Type: text/html\r\n")
                //首部字段和消息实体中间的空行
                .append("\r\n")
                //内容部分
                .append("hello tomcat");
		//获取客户端通道的输出流
        OutputStream outputStream = socket.getOutputStream();
        //往输出流通道写消息
        outputStream.write(responseBuilder.toString().getBytes());
        //流是有缓存机制的,写消息的时候不一定立马发出去,刷一下才能保证数据发送出去
        outputStream.flush();
        //关闭输出流通道
        outputStream.close();
    }
}

上面的代码初学者可以自己模仿着写一个,相信对 Http 会有很深刻的体验。代码中主要是监听连接,客户端连接后,根据 Http 协议进行字符串的拼接返回给客户端,客户端浏览器接收到是标准的 Http 格式就会进行渲染。

4. 小结

这边的代码虽然很简单,但是最核心的 Http 服务雏形已经展示出来了,成熟的 Http 服务可以在这基础上对以下模块进行优化:

  • 针对请求事件的 线程 / IO 优化;
  • Servlet 协议支持;
  • 配置独立管理;
  • Http协议内容完善(比如缓存机制);
  • 支持虚拟主机配置;
  • 支持代理;
  • rewrite 机制;
  • 安全认证。