1.什么是ip?
ip即ip地址,有ipv4和ipv6,ip对应一台正在上网的主机
本机默认ip:127.0.0.1
互联网中每个ip是全球唯一的,是由国际组织NIC负责统一分配的
2.ip与域名的解析
域名可以理解为ip的别名,域名比ip更容易记住
本机的域名(习惯上,本机域名也叫主机名)为localhost
网络dns可以解析域名,本机的hosts文件也可以解析
可以使用hosts文件自定义本机域名, hosts文件解析优先级高于网络dns服务器
3.url:统一资源定位符
由万维网规定,是互联网标准
每个url对应一个资源文件,比如https://www.52dixiaowo.com/index.html
url可以分成协议,主机,端口,目录(这里包含请求参数),四部分
查询串:name=value的查询参数,是目录中的一部分
与url相近的概念有uri,urn
- uri:是url中的目录,是url中的最后一部分
- urn:类似书名
4.http协议基本概念;
- 概念:Hyper Text Transfer Protocol超文本传输协议
- 是基于TCP/IP的高级协议
- 默认端口80
- 一次请求对应一次响应
- 不同的请求中不能交互信息
- 通常使用1.1以上版本,不会立即断开
5.http协议的请求格式:
- 请求行:请求方式,请求url,请求协议/版本
- 请求头:头名称,值
- refer请求头:表名了客户端来源,可以对此防盗链
- User-Agent : 客户端代理, 字符串值, 判断是浏览器还是爬虫
- 请求空行:起分行作用
- 请求体:请求键名,请求值
6.http协议的响应格式:
- 响应行
- 组成:协议/版本 状态码 状态码描述
- 状态码:http协议中已详细介绍
- 响应头
- 格式:头名称:值
- 常见的响应头:
- Content-Type:响应体数据格式以及编码
- Content-disposition:打开响应体数据的格式
- in-line:默认值,当前页面打开
- attachment;filename=xxx:附件形式(即下载形式)
- 响应空行
- 响应体:传输的数据
7.请求行中的请求方式详解:
- get:请求参数拼接在url后,长度有限,可以直接使用url实现(请求默认值)
- post:相对安全,长度无限制,传递参数不可见(抓包工具可以抓取)
- 还有几种不常用的,如下
- head,用于获取报头
- put,向服务器发送数据代替指定的内容
- delete,请求服务器删除指定的页面
- connect,预留给能将连接改为管道方式的代理服务器
- options,允许客户端查看服务器的性能
- trace,回显服务器收到的请求,主要用于测试或诊断
8.响应行中的状态码详解:
- 功能:是告诉用户本次请求的结果的一种表示
- 1xx:服务器接收未完成,等待继续接受
- 2xx:成功。代表:200
- 3xx:重定向。代表:302。(缓存)304
- 4xx:客户端错误。404(找不到),403(无权访问),405(请求方式错误)
- 5xx:服务器端错误。代表:500
9.发送请求的几种方法
- 使用表单发送(直接发送)
- 使用ajax异步发送请求(后端发送)
10.处理接收的响应
- 只有异步请求发送的请求,页面不跳转,可以接收并处理
- 直接发送请求时,页面会跳转,转入新页面