代理是网络中的一项重要的功能,其功能就是代理网络用户去取得网络信息。形象的说:它是网络信息的中转站,对于客户端来说,代理扮演的是服务器的角色,接收请求报文,返回响应报文;对于web服务器来说,代理扮演的是客户端的角色,发送请求报文,接收响应报文。

代理具有多种类型,如果是根据网络用户划分的话,可以划分为正向代理和反向代理:

  • 正向代理:将客户端作为网络用户。客户端访问服务端时,先访问代理服务器,随后代理服务器再访问服务端。此过程需客户端进行代理配置,对服务端透明。
  • 反向代理:将服务端作为网络用户。访问过程与正向代理相同,不过此过程对客户端透明,需服务端进行代理配置(也可不配置)。

针对正向代理和反向代理,分别有不同的代理协议,即代理服务器和网络用户之间通信所使用的协议:

  • 正向代理:

    • http
    • https
    • socks4
    • socks5
    • vpn:就功能而言,vpn也可以被认为是代理
  • 反向代理:
    • tcp
    • udp
    • http
    • https

接下来我们就说说http代理。

http代理概述

http代理是正向代理中较为简单的代理方式,它使用http协议作为客户端和代理服务器的传输协议。

http代理可以承载http协议,https协议,ftp协议等等。对于不同的协议,客户端和代理服务器间的数据格式略有不同。

http协议

我们先来看看http协议下客户端发送给代理服务器的HTTP Header:

// 直接连接
GET / HTTP/1.1
Host: staight.github.io
Connection: keep-alive // http代理
GET http://staight.github.io/ HTTP/1.1
Host: staight.github.io
Proxy-Connection: keep-alive

可以看到,http代理比起直接连接:

  • url变成完整路径,/->http://staight.github.io/
  • Connection字段变成Proxy-Connection字段
  • 其余保持原样

为什么使用完整路径?

为了识别目标服务器。如果没有完整路径,且没有Host字段的话,代理服务器将无法得知目标服务器的地址。

为什么使用Proxy-Connection字段代替Connection字段?

为了兼容使用HTTP/1.0协议的过时的代理服务器。HTTP/1.1才开始有长连接功能,直接连接的情况下,客户端发送的HTTP Header中如果有Connection: keep-alive字段,表示使用长连接和服务端进行http通信,但如果中间有过时的代理服务器,该代理服务器将无法与客户端和服务端进行长连接,造成客户端和服务端一直等待,白白浪费时间。因此使用Proxy-Connection字段代替Connection字段,如果代理服务器使用HTTP/1.1协议,能够识别Proxy-Connection字段,则将该字段转换成Connection再发送给服务端;如果不能识别,直接发送给服务端,因为服务端也无法识别,则使用短连接进行通信。

http代理http协议交互过程如图:

https协议

接下来我们来看看https协议下,客户端发送给代理服务器的HTTP Header:

CONNECT staight.github.io:443 HTTP/1.1
Host: staight.github.io:443
Proxy-Connection: keep-alive

如上,https协议和http协议相比:

  • 请求方法从GET变成CONNECT
  • url没有protocol字段

实际上,由于https下客户端和服务端的通信除了开头的协商以外都是密文,中间的代理服务器不再承担修改http报文再转发的功能,而是一开始就和客户端协商好服务端的地址,随后的tcp密文直接转发即可。

http代理https协议交互过程如图:

代码实现

首先,创建tcp服务,并且对于每个tcp请求,均调用handle函数:

	// tcp连接,监听8080端口
l, err := net.Listen("tcp", ":8080")
if err != nil {
log.Panic(err)
} // 死循环,每当遇到连接时,调用handle
for {
client, err := l.Accept()
if err != nil {
log.Panic(err)
} go handle(client)
}

然后将获取的数据放入缓冲区:

	// 用来存放客户端数据的缓冲区
var b [1024]byte
//从客户端获取数据
n, err := client.Read(b[:])
if err != nil {
log.Println(err)
return
}

从缓冲区读取HTTP请求方法,URL等信息:

	var method, URL, address string
// 从客户端数据读入method,url
fmt.Sscanf(string(b[:bytes.IndexByte(b[:], '\n')]), "%s%s", &method, &URL)
hostPortURL, err := url.Parse(URL)
if err != nil {
log.Println(err)
return
}

http协议和https协议获取地址的方式不同,分别处理:

	// 如果方法是CONNECT,则为https协议
if method == "CONNECT" {
address = hostPortURL.Scheme + ":" + hostPortURL.Opaque
} else { //否则为http协议
address = hostPortURL.Host
// 如果host不带端口,则默认为80
if strings.Index(hostPortURL.Host, ":") == -1 { //host不带端口, 默认80
address = hostPortURL.Host + ":80"
}
}

用获取到的地址向服务端发起请求。如果是http协议,将客户端的请求直接转发给服务端;如果是https协议,发送http响应:

	//获得了请求的host和port,向服务端发起tcp连接
server, err := net.Dial("tcp", address)
if err != nil {
log.Println(err)
return
}
//如果使用https协议,需先向客户端表示连接建立完毕
if method == "CONNECT" {
fmt.Fprint(client, "HTTP/1.1 200 Connection established\r\n\r\n")
} else { //如果使用http协议,需将从客户端得到的http请求转发给服务端
server.Write(b[:n])
}

最后,将所有客户端的请求转发至服务端,将所有服务端的响应转发给客户端:

	//将客户端的请求转发至服务端,将服务端的响应转发给客户端。io.Copy为阻塞函数,文件描述符不关闭就不停止
go io.Copy(server, client)
io.Copy(client, server

完整的源代码:

package main

import (
"bytes"
"fmt"
"io"
"log"
"net"
"net/url"
"strings"
) func main() {
// tcp连接,监听8080端口
l, err := net.Listen("tcp", ":8080")
if err != nil {
log.Panic(err)
} // 死循环,每当遇到连接时,调用handle
for {
client, err := l.Accept()
if err != nil {
log.Panic(err)
} go handle(client)
}
} func handle(client net.Conn) {
if client == nil {
return
}
defer client.Close() log.Printf("remote addr: %v\n", client.RemoteAddr()) // 用来存放客户端数据的缓冲区
var b [1024]byte
//从客户端获取数据
n, err := client.Read(b[:])
if err != nil {
log.Println(err)
return
} var method, URL, address string
// 从客户端数据读入method,url
fmt.Sscanf(string(b[:bytes.IndexByte(b[:], '\n')]), "%s%s", &method, &URL)
hostPortURL, err := url.Parse(URL)
if err != nil {
log.Println(err)
return
} // 如果方法是CONNECT,则为https协议
if method == "CONNECT" {
address = hostPortURL.Scheme + ":" + hostPortURL.Opaque
} else { //否则为http协议
address = hostPortURL.Host
// 如果host不带端口,则默认为80
if strings.Index(hostPortURL.Host, ":") == -1 { //host不带端口, 默认80
address = hostPortURL.Host + ":80"
}
} //获得了请求的host和port,向服务端发起tcp连接
server, err := net.Dial("tcp", address)
if err != nil {
log.Println(err)
return
}
//如果使用https协议,需先向客户端表示连接建立完毕
if method == "CONNECT" {
fmt.Fprint(client, "HTTP/1.1 200 Connection established\r\n\r\n")
} else { //如果使用http协议,需将从客户端得到的http请求转发给服务端
server.Write(b[:n])
} //将客户端的请求转发至服务端,将服务端的响应转发给客户端。io.Copy为阻塞函数,文件描述符不关闭就不停止
go io.Copy(server, client)
io.Copy(client, server)
}

添加代理,然后运行:

运行成功!

参考文档

HTTP 代理原理及实现(一):https://imququ.com/post/web-proxy.html

Http 请求头中的 Proxy-Connection:https://imququ.com/post/the-proxy-connection-header-in-http-request.html

最新文章

  1. Win10搭建Linux开发环境之网络连接设定
  2. PLL失锁
  3. ASP.NET Web Api 安全性(转载)
  4. Cash Cow【dfs较难题应用】【sdut2721】
  5. Centos6.X下安装php nginx mysql 环境
  6. HashMap,HashTable,TreeMap区别和用法
  7. ASP.NET自定义错误页面
  8. 在Linux中,如何取出一个字符串的前5位
  9. Backward Digit Sums(POJ 3187)
  10. HDU2124 Repair the Wall(贪心)
  11. hdu2141AC代码分享
  12. Web测试到底是在测什么(资料合集)
  13. 如何将多个C文件链接在一起----Makefile编写及make指令
  14. windows下零基础gulp构建
  15. 电子产品使用感受之——我的Mac只有256GB,我的照片库该怎么办?
  16. Java 实现ftp 文件上传、下载和删除
  17. PyCharm提交代码到git
  18. 【MySQL】percona-toolkit工具包
  19. 几种方法来实现scp拷贝时无需输入密码
  20. python-序列化模块

热门文章

  1. 未完待续【java】JavaEE学习路线总览
  2. k8s手动扩缩容
  3. 搭建docker镜像仓库(一):使用registry搭建本地镜像仓库
  4. const修饰符总结
  5. RT-Thread Studio增加软件包操作
  6. Spring Boot2配置Swagger2生成API接口文档
  7. 使用 Win2D 实现融合效果
  8. 使用filebeat过滤掉部分字段
  9. Elasticsearch:shard 分配感知
  10. 获取 Docker 容器的 PID 号