文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

怎么实现一个Http服务器

2023-06-04 22:06

关注

这期内容当中小编将会给大家带来有关怎么实现一个Http服务器,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

说到http协议和http请求,很多人都知道,但是他们真的“知道”吗?我面试过很多求职者,一说到http协议,他们能滔滔不绝,然后我问他http协议的具体格式是啥样子的?很多人不清楚,不清楚就不清楚吧,他甚至能将http协议的头扯到html文档头部。当我问http GET和POST请求的时候,GET请求是什么形式一般人都可以答出来,但是POST请求的数据放在哪里,服务器如何识别和解析这些POST数据,很多人又说不清道不明了。当说到http服务器时,很多人离开了apache、Nginx这样现成的http server之外,自己实现一个http服务器无从下手,如果实际应用场景有需要使用到一些简单http请求时,使用apache、Nginx这样重量级的http服务器程序实在劳师动众,你可以尝试自己实现一个简单的。

上面提到的问题,如果您不能清晰地回答出来,可以阅读一下这篇文章,这篇文章在不仅介绍http的格式,同时带领大家从零实现一个简单的http服务器程序。

http协议介绍

http协议是应用层协议,一般建立在tcp协议的基础之上(当然你的实现非要基于udp也是可以的),也就是说http协议的数据收发是通过tcp协议的。

http协议也分为head和body两部分,但是我们一般说的html中的和标记不是http协议的头和身体,它们都是http协议的body部分。

怎么实现一个Http服务器

那么http协议的头到底长啥样子呢?我们来介绍一下http协议吧。

http协议的格式如下:

1GET或POST 请求的url路径(一般是去掉域名的路径) HTTP协议版本号\r\n 2字段1名: 字段1值\r\n 3字段2名: 字段2值\r\n 4     … 5字段n名 : 字段n值\r\n 6\r\n 7http协议包体内容

也就是说http协议由两部分组成:包头和包体,包头与包体之间使用一个\r\n分割,由于http协议包头的每一行都是以\r\n结束,所以http协议包头一般以\r\n\r\n结束。

举个例子,比如我们在浏览器中请求http://www.hootina.org/index_2013.php这个网址,这是一个典型的GET方法,浏览器组装的http数据包格式如下:

GET /index_2013.php HTTP/1.1\r\n 2Host: www.hootina.org\r\n 3Connection: keep-alive\r\n 4Upgrade-Insecure-Requests: 1\r\n 5User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36\r\n 6Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,**;q=0.8\r\n 7Accept-Encoding: gzip, deflate\r\n 8Accept-Language: zh-CN,zh;q=0.9,en;q=0.8\r\n 9\r\n

对比一下,你现在知道http协议的GET参数放在协议包的什么位置了吧。

那么POST的数据放在什么位置呢?我们再12306网站https://kyfw.12306.cn/otn/login/init中登陆输入用户名和密码:

怎么实现一个Http服务器

然后发现浏览器以POST方式组装了http协议包发送了我们的用户名、密码和其他一些信息,组装的包格式如下:

POST /passport/web/login HTTP/1.1\r\n  2Host: kyfw.12306.cn\r\n  3Connection: keep-alive\r\n  4Content-Length: 55\r\n  5Accept: application/json, text/javascript, * 24    //检查是否以\r\n\r\n结束,如果不是说明包头不完整,退出 25    string end = inbuf.substr(inbuf.length() - 4); 26    if (end != "\r\n\r\n") 27        return; 28 29    //以\r\n分割每一行 30    std::vector<string> lines; 31    StringUtil::Split(inbuf, lines, "\r\n"); 32    if (lines.size() < 1 || lines[0].empty()) 33    { 34        conn->forceClose(); 35        return; 36    } 37 38    std::vector<string> chunk; 39    StringUtil::Split(lines[0], chunk, " "); 40    //chunk中至少有三个字符串:GET+url+HTTP版本号 41    if (chunk.size() < 3) 42    { 43        conn->forceClose(); 44        return; 45    } 46 47    LOG_INFO << "url: " << chunk[1] << " from " << conn->peerAddress().toIpPort(); 48    //inbuf = /register.do?p={%22username%22:%20%2213917043329%22,%20%22nickname%22:%20%22balloon%22,%20%22password%22:%20%22123%22} 49    std::vector<string> part; 50    //通过?分割成前后两端,前面是url,后面是参数 51    StringUtil::Split(chunk[1], part, "?"); 52    //chunk中至少有三个字符串:GET+url+HTTP版本号 53    if (part.size() < 2) 54    { 55        conn->forceClose(); 56        return; 57    } 58 59    string url = part[0]; 60    string param = part[1].substr(2); 61 62    if (!Process(conn, url, param)) 63    { 64        LOG_ERROR << "handle http request error, from:" << conn->peerAddress().toIpPort() << ", request: " << pBuffer->retrieveAllAsString(); 65    } 66 67    //短连接,处理完关闭连接 68    conn->forceClose(); 69}

代码注释都写的很清楚,我们先利用\r\n分割得到每一行,其中第一行的数据是:

GET /register.do?p={%22username%22:%20%2213917043329%22,%20%22nickname%22:%20%22balloon%22,%20%22password%22:%20%22123%22} HTTP/1.1

其中%22是双引号的url转码形式,%20是空格的url转码形式,然后我们根据空格分成三段,其中第二段就是我们的网址和参数:

/register.do?p={%22username%22:%20%2213917043329%22,%20%22nickname%22:%20%22balloon%22,%20%22password%22:%20%22123%22}

然后我们根据网址与参数之间的问号将这个分成两段:第一段是网址,第二段是参数:

1bool HttpSession::Process(const std::shared_ptr<TcpConnection>& conn, const std::string& url, const std::string& param)  2{  3    if (url.empty())  4        return false;  5  6    if (url == "/register.do")  7    {  8        OnRegisterResponse(param, conn);  9    } 10    else if (url == "/login.do") 11    { 12        OnLoginResponse(param, conn); 13    } 14    else if (url == "/getfriendlist.do") 15    { 16 17    } 18    else if (url == "/getgroupmembers.do") 19    { 20 21    } 22    else 23        return false; 24 25 26    return true; 27}

然后我们根据url匹配网址,如果是注册请求,会走注册处理逻辑:

void HttpSession::OnRegisterResponse(const std::string& data, const std::shared_ptr<TcpConnection>& conn)  2{  3    string retData;  4    string decodeData;  5    URLEncodeUtil::Decode(data, decodeData);  6    BussinessLogic::RegisterUser(decodeData, conn, false, retData);  7    if (!retData.empty())  8    {  9        std::string response; 10        URLEncodeUtil::Encode(retData, response); 11        MakeupResponse(retData, response); 12        conn->send(response); 13 14        LOG_INFO << "Response to client: cmd=msg_type_register" << ", data=" << retData << conn->peerAddress().toIpPort();; 15    } 16}

注册结果放在retData中,为了发给客户端,我们将结果中的特殊字符如双引号转码,如返回结果是:

{"code":0, "msg":"ok"}

会被转码成:

{%22code%22:0,%20%22msg%22:%22ok%22}

然后,将数据组装成http协议发给客户端,给客户端的应答协议与http请求协议有一点点差别,就是将请求的url路径换成所谓的http响应码,如200表示应答正常返回、404页面不存在。应答协议格式如下:

GET或POST 响应码 HTTP协议版本号\r\n 2字段1名: 字段1值\r\n 3字段2名: 字段2值\r\n 4     … 5字段n名 : 字段n值\r\n 6\r\n 7http协议包体内容

举个例子如:

HTTP/1.1 200 OK\r\n Content-Type: text/html\r\n Content-Length:42\r\n \r\n {%22code%22:%200,%20%22msg%22:%20%22ok%22}

注意,包头中的Content-Length长度必须正好是包体{%22code%22:%200,%20%22msg%22:%20%22ok%22}的长度,这里是42。这也符合我们浏览器的返回结果:

怎么实现一个Http服务器

当然,需要注意的是,我们一般说http连接一般是短连接,这里我们也实现了这个功能(看上面的代码:conn->forceClose();),不管一个http请求是否成功,服务器处理后立马就关闭连接。

当然,这里还有一些没处理好的地方,如果你仔细观察上面的代码就会发现这个问题,就是不满足一个http包头时的处理,如果某个客户端(不是使用浏览器)通过程序模拟了一个连接请求,但是迟迟不发含有\r\n\r\n的数据,这路连接将会一直占用。我们可以判断收到的数据长度,防止别有用心的客户端给我们的服务器乱发数据。我们假定,我们能处理的最大url长度是2048,如果用户发送的数据累积不含\r\n\r\n,且超过2048个,我们认为连接非法,将连接断开。代码修改成如下形式:

void HttpSession::OnRead(const std::shared_ptr<TcpConnection>& conn, Buffer* pBuffer, Timestamp receivTime) {     //LOG_INFO << "Recv a http request from " << conn->peerAddress().toIpPort();      string inbuf;     //先把所有数据都取出来     inbuf.append(pBuffer->peek(), pBuffer->readableBytes());     //因为一个http包头的数据至少\r\n\r\n,所以大于4个字符     //小于等于4个字符,说明数据未收完,退出,等待网络底层接着收取     if (inbuf.length() <= 4)         return;      //我们收到的GET请求数据包一般格式如下:          //检查是否以\r\n\r\n结束,如果不是说明包头不完整,退出     string end = inbuf.substr(inbuf.length() - 4);     if (end != "\r\n\r\n")         return;     //超过2048个字符,且不含\r\n\r\n,我们认为是非法请求     else if (inbuf.length() >= MAX_URL_LENGTH)     {         conn->forceClose();         return;     }      //以\r\n分割每一行     std::vector<string> lines;     StringUtil::Split(inbuf, lines, "\r\n");     if (lines.size() < 1 || lines[0].empty())     {         conn->forceClose();         return;     }      std::vector<string> chunk;     StringUtil::Split(lines[0], chunk, " ");     //chunk中至少有三个字符串:GET+url+HTTP版本号     if (chunk.size() < 3)     {         conn->forceClose();         return;     }      LOG_INFO << "url: " << chunk[1] << " from " << conn->peerAddress().toIpPort();     //inbuf = /register.do?p={%22username%22:%20%2213917043329%22,%20%22nickname%22:%20%22balloon%22,%20%22password%22:%20%22123%22}     std::vector<string> part;     //通过?分割成前后两端,前面是url,后面是参数     StringUtil::Split(chunk[1], part, "?");     //chunk中至少有三个字符串:GET+url+HTTP版本号     if (part.size() < 2)     {         conn->forceClose();         return;     }      string url = part[0];     string param = part[1].substr(2);      if (!Process(conn, url, param))     {         LOG_ERROR << "handle http request error, from:" << conn->peerAddress().toIpPort() << ", request: " << pBuffer->retrieveAllAsString();     }      //短连接,处理完关闭连接     conn->forceClose(); }

但这只能解决发送非法数据的情况,如果一个客户端连上来不给我们发任何数据,这段逻辑就无能为力了。如果不断有客户端这么做,会浪费我们大量的连接资源,所以我们还需要一个定时器去定时检测哪些http连接超过一定时间内没给我们发数据,找到后将连接断开。

上述就是小编为大家分享的怎么实现一个Http服务器了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-服务器
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯