HTTP是基于TCP的高级协议,同时HTTP是一个软协议,它只是对TCP进行了传输格式的规定。
HTTP是无状态的协议,按请求与响应分为http请求与http响应,它们的格式基本相同
HTTP协议组成
HTTP协议由4部分组成,以HTTP请求来看,分别是
- 请求行
- 请求头
- 请求空行
- 请求体
请求行
其中,请求行的格式固定为一行,例如以下格式:
get /index.html HTTP/1.1
换成文字说明是:
请求方式 URI 协议/版本
请求方式有多种,get/post/put等,协议可能是http/https,版本有多种,如果是1.0则固定为短连接,而1.1以后均为长连接。
请求行的几个参数之间是有且仅有一个空格分隔。
请求头
请求头的作用是,给服务器一些描述信息,这些信息可能包括:浏览器版本,可接受的数据类型等
这些信息非常有用,因为HTTP是无状态的,如果没有请求头,在某些时候你无法分辨到底是谁请求了资源。
例如,只想给携带了User-Agent为xxx的请求响应资源,那么你就必须添加这个请求头信息,这样也可以很好的过滤不符合条件的请求。
此外,如果存在请求体,则必须在请求头指定请求体的大小,使用Content-Length表示字节大小,这是为了正确的接收数据以及及时的取出系统的临时存储数据防止服务器崩溃。
常见的请求头例如:
Accept-Charset:浏览器可接受的字符集;
Content-Length:表示请求消息正文的长度;
User-Agent:浏览器类型,如果Servlet返回的内容与浏览器类型有关则该值非常有用;
请求空行
请求空行是为了正确的分割请求头与请求体。
请求头可能有一个或者多个,我们无法确定它有几个,这点与请求体是一样的,所以必须有请求空行。
但此部分在描述时往往会被省略,却又是必须存在的。
请求体
请求体不一定存在,只有用户向服务器上传数据时,才需要此项。
请求体中存放上传的数据,其长度必须在请求头中指明字节长度。
请求体中的数据有可能是加密的,或者是转编码的,无法直接查看。
Py实现静态服务器
静态服务器在这里指的是直接返回HTML文档。
基本的实现流程是:用户在浏览器访问URL -> Python接收并解析URI,以I/O流获取该路径下的资源并返回给客户端。
注意:HTMP文档中存在其他资源时,比如图片,css,js文件,会自动再次发出请求,这意味着服务器每次服务完毕后不能直接关闭连接,HTTP协议中一般由客户端关闭连接,关闭时也会自动发出一个请求而数据为空,服务器接收后判断为空说明客户端断开,此时服务器再断开即可。
实现代码如下:
import socket
import re
def service_client(new_socket):
"""为这个客户端返回数据"""
# 1. 接收浏览器发送过来的请求 ,即http请求
# GET / HTTP/1.1
# .....
request = new_socket.recv(1024).decode("utf-8")
# print(">>>"*50)
# print(request)
request_lines = request.splitlines()
print("")
print(">"*20)
print(request_lines)
# GET /index.html HTTP/1.1
# get post put del
file_name = ""
ret = re.match(r"[^/]+(/[^ ]*)", request_lines[0])
if ret:
file_name = ret.group(1)
# print("*"*50, file_name)
if file_name == "/":
file_name = "/index.html"
# 2. 返回http格式的数据,给浏览器
try:
f = open("./html" + file_name, "rb")
except:
response = "HTTP/1.1 404 NOT FOUND\r\n"
response += "\r\n"
response += "------file not found-----"
new_socket.send(response.encode("utf-8"))
else:
html_content = f.read()
f.close()
# 2.1 准备发送给浏览器的数据---header
response = "HTTP/1.1 200 OK\r\n"
response += "\r\n"
# 2.2 准备发送给浏览器的数据---boy
# response += "hahahhah"
# 将response header发送给浏览器
new_socket.send(response.encode("utf-8"))
# 将response body发送给浏览器
new_socket.send(html_content)
# 关闭套接
new_socket.close()
def main():
"""用来完成整体的控制"""
# 1. 创建套接字
tcp_server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
tcp_server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
# 2. 绑定
tcp_server_socket.bind(("", 7890))
# 3. 变为监听套接字
tcp_server_socket.listen(128)
while True:
# 4. 等待新客户端的链接
new_socket, client_addr = tcp_server_socket.accept()
# 5. 为这个客户端服务
service_client(new_socket)
# 关闭监听套接字
tcp_server_socket.close()
if __name__ == "__main__":
main()
此代码绑定7890端口,默认返回./html目录下的静态页面。
更多内容,请查看下一小节。