在Windows中用C语言编写HTTP服务器
acmilan2017/02/12软件综合 IP:四川

虽然有更原生的做法(用WinHTTP),但是用Socket编写可以更好地理解HTTP协议。

其实挺简单的,就是在socket上面再凑出一个头部来。先发送HTTP/1.1 200 OK,然后Content-Type: text/html; charset=utf-8,然后一个空行,再发送响应内容就行了。

比较麻烦的地方是Windows环境下生成UTF-8有点麻烦,还要转换,一般来说我们用宽字符生成响应内容,宽字符与char之间的转换只用28591和65001两个代码页就行了,ASCII或ISO-8859-1用28591,UTF-8用65001。一般来说,C语言使用wchar_t处理字符串,要比char好一些,即使是在Linux下也是如此。

如果要解析请求路径,要注意的是URL对于非ASCII信息是经过UTF-8百分号%XX编码的,需要自己进行解码。请求内容也经过百分号%XX编码,除非设置表单为enctype="multipart/form-data"。

为了简洁,这里使用固定缓冲区,如果超了的话,浏览器会报连接重置,改成动态缓冲区可解决这一问题。

现代浏览器会额外产生一个request,GET /favicon.ico HTTP/1.1,用来获取图标,一般来说忽略它即可。

另一个小知识:

swprintf是支持动态分配缓冲区的,使用size = swprintf(NULL, 0, L"formatstr", ...);计算所需缓冲区大小,然后用malloc/calloc/alloca分配(size+1)*sizeof(wchar_t)缓冲区,再swprintf(buf, size + 1, L"formatstr", ...);进行实际的格式化。

snprintf只有VC++2015以上才支持,旧版本只能用_snprintf,后者类似strncpy,在缓冲区小于size+1的时候不会添加'\0',因此缓冲区一定要清零,并且第二个参数应该传size而不是size+1,否则会产生缓冲区溢出风险。即必须memset(buf, 0, size + 1); _snprintf(buf, size, "formatstr", ...);这样使用。

一个典型的响应:

<code class="language-txt">服务器工作正常
您的IP地址:127.0.0.1
您的本地端口号:30087
请求头部:
GET /%E6%B5%8B%E8%AF%95%E8%B7%AF%E5%BE%84aaa%20bbb HTTP/1.1
Host: 127.0.0.1:8080
Connection: keep-alive
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36
Accept-Encoding: gzip, deflate, sdch
Accept-Language: zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4,en-US;q=0.2
</code>

另一个响应:

<code class="language-txt">服务器工作正常
您的IP地址:127.0.0.1
您的本地端口号:30092
请求头部:
POST /%E6%B5%8B%E8%AF%95%E8%B7%AF%E5%BE%84aaa%20bbb HTTP/1.1
Host: 127.0.0.1:8080
Connection: keep-alive
Content-Length: 101
Cache-Control: max-age=0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Origin: <http: 127.0.0.1:8080>
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: <http: 127.0.0.1:8080 %e6%b5%8b%e8%af%95%e8%b7%af%e5%be%84aaa%20bbb>
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4,en-US;q=0.2

name=%E6%B5%8B%E8%AF%95%E5%86%85%E5%AE%B9&text=%E6%B5%8B%E8%AF%95%E5%86%85%E5%AE%B9%0D%0Aaaa%0D%0Abbb
</http:></http:></code>
<code class="language-cpp">// winsockhttp1.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"

#include <windows.h>
#include <winsock.h>
#pragma comment(lib, "ws2_32.lib")

int _tmain(int argc, _TCHAR* argv[])
{
	// 初始化环境
	WSADATA wsadata;
	WSAStartup(MAKEWORD(2, 2), &wsadata);

	// 创建本地
	SOCKET sock;
	sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
	if (sock == INVALID_SOCKET)
	{
		printf(">> socket error\n");
		return 0;
	}
	printf(">> socket\n");

	// 绑定本地
	SOCKADDR_IN addr;
	addr.sin_addr.S_un.S_addr = inet_addr("0.0.0.0");
	addr.sin_family = AF_INET;
	addr.sin_port = htons(8080);
	int retval = bind(sock, (SOCKADDR*)&addr, sizeof addr);
	if (retval == SOCKET_ERROR)
	{
		printf(">> bind error\n");
		closesocket(sock);
		return 0;
	}
	printf(">> bind %s:%d\n", inet_ntoa(addr.sin_addr), ntohs(addr.sin_port));

	// 监听
	retval = listen(sock, 5);
	if (retval == SOCKET_ERROR)
	{
		printf(">> listen error\n");
		closesocket(sock);
		return 0;
	}
	printf(">> listen\n", inet_ntoa(addr.sin_addr), ntohs(addr.sin_port));

	while (1)
	{
		// 接受连接
		SOCKADDR_IN client_addr;
		int client_addr_len = sizeof client_addr;
		SOCKET client = accept(sock, (SOCKADDR*)&client_addr, &client_addr_len);
		if (client == INVALID_SOCKET)
		{
			printf(">> accept error\n");
			continue;
		}
		printf(">> accept %s:%d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));

		// 接收请求内容
		char request[65536] = "";
		retval = recv(client, request, 65535, 0);
		if (retval == SOCKET_ERROR)
		{
			printf(">> recv request error\n");
			closesocket(client);
			continue;
		}
		printf(">> recv request %d\n", retval);
		//printf(">> request string:\n%s\n", request);
		
		// 纯ASCII内容一般使用28591代码页(ISO-8859-1)处理
		char *in_addr = inet_ntoa(client_addr.sin_addr);
		wchar_t in_addr_wide[32] = L"";
		MultiByteToWideChar(28591, 0, in_addr, -1, in_addr_wide, 32);
		wchar_t request_wide[65536] = L"";
		MultiByteToWideChar(28591, 0, request, -1, request_wide, 65536);

		// 通过宽字符生成UTF-8的响应内容
		wchar_t content_fmt[] =
			L"<html>"
			L"<head>"
			L"<title>测试页面</title>"
			L"</head>"
			L"<body>"
			L"<form action="\"\"" method="\"post\"">"
			L"<input type="\"text\"" name="\"name\""><br>"
			L"<textarea name="\"text\""></textarea><br>"
			L"<input type="\"submit\"">"
			L"</form>"
			L"服务器工作正常<br>"
			L"您的IP地址:%ls<br>"
			L"您的本地端口号:%d<br>"
			L"请求头部:"
			L"<pre>%ls
" L"</body>" L"</html>"; wchar_t content_wide[65536] = L""; swprintf(content_wide, 65536, content_fmt, in_addr_wide, ntohs(client_addr.sin_port), request_wide); char content[65536] = ""; WideCharToMultiByte(CP_UTF8, 0, content_wide, -1, content, 65536, NULL, NULL); // 生成响应头部 char header[] = "HTTP/1.1 200 OK\r\n" "Content-Type: text/html; charset=utf-8\r\n" "\r\n"; // 发送响应头部 retval = send(client, header, strlen(header), 0); if (retval == SOCKET_ERROR) { printf(">> send header error\n"); closesocket(client); continue; } printf(">> send header %d\n", retval); // 发送响应内容 retval = send(client, content, strlen(content), 0); if (retval == SOCKET_ERROR) { printf(">> send content error\n"); closesocket(client); continue; } printf(">> send content %d\n", retval); // 关闭连接 closesocket(client); printf(">> closesocket\n"); } // 关闭本地 closesocket(sock); printf(">> closesocket\n"); // 清理环境 WSACleanup(); return 0; } </winsock.h></windows.h>

[修改于 7年3个月前 - 2017/02/12 23:36:38]

来自:计算机科学 / 软件综合
2
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
acmilan 作者
7年3个月前 修改于 7年3个月前 IP:四川
830613

HTTP比较怪的地方在于,它是非常文本化的协议,不需要写任何结构体,但是非常需要字符串处理技巧。还有,回车符必须用\r\n,而且在两个回车之后还支持二进制文件。

服务器和客户端程序不同,非常看重稳定性,所以不到必须退出的情况下,绝对不要退出。必要的情况下,甚至可以使用try{}catch(...){}和signal(SIG_IGN)处理一下以防意外退出。

Linux下也支持宽字符,只是它们使用UTF-32,并且使用setlocale和wcstombs/mbstowcs进行转换。iconv不建议一般人使用,它基于状态机设计,而不是允许预分配缓冲区的设计,不如setlocale和wcstombs/mbstowcs好用。

  • Linux下wcstombs相当于:对于65001代码页来说,等价于WideCharToMultiByte返回值减1。对于其它代码页来说,等价于WideCharToMultiByte检查最后一个参数pfUsedDefaultChar是否被置位,如果被置位返回-1,否则返回值减1。
  • 以下两个等价
    • setlocale(LC_CTYPE, "xxxxxx");
      retval = wcstombs(dst, src, dstsize);
    • BOOL useddefchr = FALSE;
      retval = WideCharToMultiByte(codepage, 0, src, -1, dst, dstsize, NULL, codepage == 65001 ? NULL : &useddefchr) - 1;
      retval = useddefchr ? -1 : useddefchr;
  • Linux下mbstowcs相当于:等价于MultiByteToWideChar第二个参数置位MB_ERR_INVALID_CHARS,并且返回值减1。
  • 以下两个等价
    • setlocale(LC_CTYPE, "xxxxxx");
      retval = wcstombs(dst, src, dstsize);
    • retval = WideCharToMultiByte(codepage, MB_ERR_INVALID_CHARS, src, -1, dst, dstsize, NULL, &useddefchr) - 1;

Linux宽字符版本:

<code class="language-cpp">// winsockhttp1.cpp : 定义控制台应用程序的入口点。
//

#include <stdio.h>
#include <locale.h>
#include <wchar.h>
#include <stdlib.h>
#include <string.h>
#include <netinet in.h>
#include <arpa inet.h>
#include <unistd.h>

int main(int argc, char* argv[])
{
    // 创建本地
    int sock;
    sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
    if (sock == -1)
    {
        printf(">> socket error\n");
        return 0;
    }
    printf(">> socket\n");

    // 绑定本地
    sockaddr_in addr;
    addr.sin_addr.s_addr = inet_addr("0.0.0.0");
    addr.sin_family = AF_INET;
    addr.sin_port = htons(8080);
    int retval = bind(sock, (sockaddr*)&addr, sizeof addr);
    if (retval == -1)
    {
        printf(">> bind error\n");
        close(sock);
        return 0;
    }
    printf(">> bind %s:%d\n", inet_ntoa(addr.sin_addr), ntohs(addr.sin_port));

    // 监听
    retval = listen(sock, 5);
    if (retval == -1)
    {
        printf(">> listen error\n");
        close(sock);
        return 0;
    }
    printf(">> listen\n", inet_ntoa(addr.sin_addr), ntohs(addr.sin_port));

    while (1)
    {
        // 接受连接
        sockaddr_in client_addr;
        unsigned int client_addr_len = sizeof client_addr;
        int client = accept(sock, (sockaddr*)&client_addr, &client_addr_len);
        if (client == -1)
        {
            printf(">> accept error\n");
            continue;
        }
        printf(">> accept %s:%d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));

        // 接收请求内容
        char request[65536] = "";
        retval = recv(client, request, 65535, 0);
        if (retval == -1)
        {
            printf(">> recv request error\n");
            close(client);
            continue;
        }
        printf(">> recv request %d\n", retval);
        //printf(">> request string:\n%s\n", request);

        // 纯ASCII内容一般使用28591代码页(ISO-8859-1)处理
        setlocale(LC_CTYPE, "C");
        char *in_addr = inet_ntoa(client_addr.sin_addr);
        wchar_t in_addr_wide[32] = L"";
        mbstowcs(in_addr_wide, in_addr, 32);
        wchar_t request_wide[65536] = L"";
        mbstowcs(request_wide, request, 65536);

        // 通过宽字符生成UTF-8的响应内容
        setlocale(LC_CTYPE, "");
        wchar_t content_fmt[] =
            L"<html>"
            L"<head>"
            L"<title>测试页面</title>"
            L"</head>"
            L"<body>"
            L"<form action="\"\"" method="\"post\"">"
            L"<input type="\"text\"" name="\"name\""><br>"
            L"<textarea name="\"text\""></textarea><br>"
            L"<input type="\"submit\"">"
            L"</form>"
            L"服务器工作正常<br>"
            L"您的IP地址:%ls<br>"
            L"您的本地端口号:%d<br>"
            L"请求头部:"
            L"<pre>%ls
" L"</body>" L"</html>"; wchar_t content_wide[65536] = L""; swprintf(content_wide, 65536, content_fmt, in_addr_wide, ntohs(client_addr.sin_port), request_wide); char content[65536] = ""; wcstombs(content, content_wide, 65536); // 生成响应头部 char header[] = "HTTP/1.1 200 OK\r\n" "Content-Type: text/html; charset=utf-8\r\n" "\r\n"; // 发送响应头部 retval = send(client, header, strlen(header), 0); if (retval == -1) { printf(">> send header error\n"); close(client); continue; } printf(">> send header %d\n", retval); // 发送响应内容 retval = send(client, content, strlen(content), 0); if (retval == -1) { printf(">> send content error\n"); close(client); continue; } printf(">> send content %d\n", retval); // 关闭连接 close(client); printf(">> closesocket\n"); } // 关闭本地 close(sock); printf(">> closesocket\n"); return 0; } </unistd.h></arpa></netinet></string.h></stdlib.h></wchar.h></locale.h></stdio.h>
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
acmilan作者
7年3个月前 修改于 7年3个月前 IP:四川
830617

这里还是吐槽一下,时代的发展出乎了意料,互联网emoji让UTF-8成了必需品,而兼容性的要求让Windows上的C语言难以高效支持UTF-8。记得前几年个人还比较喜欢编写基于GBK的程序,现在却发现使用GBK已经很难让自己满意了。如果没有互联网和Windows的分道扬镳,C语言编程的前景会不会更美好呢?

也许互联网就不该支持emoji,可是谁能挡得住?也许Windows就应该增加广泛的UTF-8支持,谁来买单?互联网从来都没有做错什么,Windows也没有做错什么,错的是人,人总是带有文化背景的偏见的,总是怀念美好的过去的,总是不愿意接受新事物比老事物更复杂,这一令人无奈的现实的。说到底,编程爱好者还是最大输家。

也许吧,错不在时代,错在没有人编写一本经典的基于宽字符的C语言入门书。。。

经典的Windows字节版本:

<code class="language-cpp">// winsockhttpansi1.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"

#include <windows.h>
#include <winsock.h>
#pragma comment(lib, "ws2_32.lib")

int _tmain(int argc, _TCHAR* argv[])
{
    // 初始化环境
    WSADATA wsadata;
    WSAStartup(MAKEWORD(2, 2), &wsadata);

    // 创建本地
    SOCKET sock;
    sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
    if (sock == INVALID_SOCKET)
    {
        printf(">> socket error\n");
        return 0;
    }
    printf(">> socket\n");

    // 绑定本地
    SOCKADDR_IN addr;
    addr.sin_addr.S_un.S_addr = inet_addr("0.0.0.0");
    addr.sin_family = AF_INET;
    addr.sin_port = htons(8080);
    int retval = bind(sock, (SOCKADDR*)&addr, sizeof addr);
    if (retval == SOCKET_ERROR)
    {
        printf(">> bind error\n");
        closesocket(sock);
        return 0;
    }
    printf(">> bind %s:%d\n", inet_ntoa(addr.sin_addr), ntohs(addr.sin_port));

    // 监听
    retval = listen(sock, 5);
    if (retval == SOCKET_ERROR)
    {
        printf(">> listen error\n");
        closesocket(sock);
        return 0;
    }
    printf(">> listen\n", inet_ntoa(addr.sin_addr), ntohs(addr.sin_port));

    while (1)
    {
        // 接受连接
        SOCKADDR_IN client_addr;
        int client_addr_len = sizeof client_addr;
        SOCKET client = accept(sock, (SOCKADDR*)&client_addr, &client_addr_len);
        if (client == INVALID_SOCKET)
        {
            printf(">> accept error\n");
            continue;
        }
        printf(">> accept %s:%d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));

        // 接收请求内容
        char request[65536] = "";
        retval = recv(client, request, 65535, 0);
        if (retval == SOCKET_ERROR)
        {
            printf(">> recv request error\n");
            closesocket(client);
            continue;
        }
        printf(">> recv request %d\n", retval);
        //printf(">> request string:\n%s\n", request);

        // 生成响应内容
        char content_fmt[] =
            "<html>"
            "<head>"
            "<title>测试页面</title>"
            "</head>"
            "<body>"
            "<form action="\"\"" method="\"post\"">"
            "<input type="\"text\"" name="\"name\""><br>"
            "<textarea name="\"text\""></textarea><br>"
            "<input type="\"submit\"">"
            "</form>"
            "服务器工作正常<br>"
            "您的IP地址:%s<br>"
            "您的本地端口号:%d<br>"
            "请求头部:"
            "<pre>%s
" "</body>" "</html>"; char content[65536] = ""; _snprintf(content, 65535, content_fmt, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port), request); // 生成响应头部 char header[] = "HTTP/1.1 200 OK\r\n" "Content-Type: text/html; charset=gbk\r\n" "\r\n"; // 发送响应头部 retval = send(client, header, strlen(header), 0); if (retval == SOCKET_ERROR) { printf(">> send header error\n"); closesocket(client); continue; } printf(">> send header %d\n", retval); // 发送响应内容 retval = send(client, content, strlen(content), 0); if (retval == SOCKET_ERROR) { printf(">> send content error\n"); closesocket(client); continue; } printf(">> send content %d\n", retval); // 关闭连接 closesocket(client); printf(">> closesocket\n"); } // 关闭本地 closesocket(sock); printf(">> closesocket\n"); // 清理环境 WSACleanup(); return 0; } </winsock.h></windows.h>
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

所属专业
所属分类
上级专业
同级专业
acmilan
进士 学者 笔友
文章
461
回复
2934
学术分
4
2009/05/30注册,5年3个月前活动
暂无简介
主体类型:个人
所属领域:无
认证方式:邮箱
IP归属地:未同步
文件下载
加载中...
{{errorInfo}}
{{downloadWarning}}
你在 {{downloadTime}} 下载过当前文件。
文件名称:{{resource.defaultFile.name}}
下载次数:{{resource.hits}}
上传用户:{{uploader.username}}
所需积分:{{costScores}},{{holdScores}}下载当前附件免费{{description}}
积分不足,去充值
文件已丢失

当前账号的附件下载数量限制如下:
时段 个数
{{f.startingTime}}点 - {{f.endTime}}点 {{f.fileCount}}
视频暂不能访问,请登录试试
仅供内部学术交流或培训使用,请先保存到本地。本内容不代表科创观点,未经原作者同意,请勿转载。
音频暂不能访问,请登录试试
支持的图片格式:jpg, jpeg, png
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}