Go Http


原文链接: Go Http

URL

URL类型 代表一个解析后的URL(或者说,一个URL参照)。

URL基本格式如下:
scheme后不是冒号加双斜线的URL被解释为如下格式:
scheme:opaque[?query][#fragment]
scheme://[userinfo@]host/path[?query][#fragment]
注意: Path字段是以解码后的格式保存的,如/%47%6f%2f会变成/Go/。
这导致我们无法确定Path字段中的斜线是来自原始URL还是解码前的%2f。除非一个客户端必须使用其他程序/函数来解析原始URL或者重构原始URL,这个区别并不重要。
此时,
HTTP服务端可以查询 req.RequestURI
HTTP客户端可以使用 Opaque
URL{Host: "example.com", Opaque: "//example.com/Go%2f"}
代替{Host: "example.com", Path: "/Go/"}。

type URL struct {
  Scheme   string 
  Opaque   string    // 编码后的不透明数据 
  User     *Userinfo // 用户名和密码信息 
  Host     string    // host或host:port 
  Path     string
  RawQuery string    // 编码后的查询字符串,不包含'?'   [?query]
  Fragment string    // 引用的片段(文档位置),没有'#' [#fragment]
}

URL的格式比较明确,其实更好的名词应该是URI,统一资源定位。
URL中比较重要的是查询字符串query。通常作为get请求的参数。query是一些使用&符号分割的key1=value1&key2=value2键值对,由于url编码是ASSIC码,因此query需要进行urlencode。
Server端可以通过request.URI.RawQuery读取query

func indexHandler(w http.ResponseWriter, r *http.Request) {
    info := fmt.Sprintln(
    "URL", r.URL, 
    "HOST", r.Host,
    "Method", r.Method,
    "RequestURL", r.RequestURI, 
    "RawQuery", r.URL.RawQuery)
    fmt.Fprintln(w, info)
}

☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
URL /?lang=zh&version=1.1.0
HOST 127.0.0.1:8000
Method POST
RequestURL /?lang=zh&version=1.1.0
RawQuery lang=zh&version=1.1.0

func main() {
	// 假设该URL没有#fragment后缀
	values, err := url.ParseRequestURI("https://www.baidu.com/s?wd=%E6%90%9C%E7%B4%A2&rsv_spt=1&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=1&rsv_sug3=7&rsv_sug1=6")
	fmt.Println(values)

	u, err := url.Parse("http://admin:Passw0d@bing.com/search/!()*[]<>?q=!()*;[]<>$&+=:#home")
	if err != nil {
		log.Fatal(err)
	}
	fmt.Println(url.PathEscape(u.RawPath))     // %2Fsearch%2F%21%28%29%2A%5B%5D%3C%3E
	fmt.Println(url.PathUnescape(u.RawPath))   // /search/!()*[]<> <nil>
	fmt.Println(url.QueryEscape(u.RawQuery))   // q%3D%21%28%29%2A%3B%5B%5D%3C%3E%24%26%2B%3D%3A
	fmt.Println(url.QueryUnescape(u.RawQuery)) // q=!()*;[]<>$& =: <nil>
	fmt.Println(u)                             //http://bing.com/search/%21%28%29%2A%5B%5D%3C%3E?q=!()*;[]<>$&+=:#home
	fmt.Println(u.User.String())               //admin:Passw0d
	fmt.Println(u.User.Username())             //admin
	fmt.Println(u.User.Password())             //Passw0d true
	fmt.Println(u.Scheme)                      //http
	fmt.Println(u.Opaque)                      //
	fmt.Println(u.Host)                        //bing.com
	fmt.Println(u.Hostname())                  //bing.com
	fmt.Println(u.Port())                      //
	fmt.Println(u.Path)                        ///search/!()*[]<>
	fmt.Println(u.RawPath)                     ///search/!()*[]<>
	fmt.Println(u.ForceQuery)                  // false
	fmt.Println(u.RawQuery)                    //q=!()*;[]<>$&+=:
	fmt.Println(u.Fragment)                    //home
	fmt.Println(u)
	u.RawQuery = u.Query().Encode()
}

Request 请求的结构

HTTP的交互以请求和响应的应答模式。go的请求我们早就见过了,handler函数的第二个参数http.Requests。其结构为:

type Request struct {
    Method string

    URL *url.URL
    Proto      string // "HTTP/1.0"
    ProtoMajor int    // 1
    ProtoMinor int    // 0
    Header Header
    Body io.ReadCloser
    ContentLength int64
    TransferEncoding []string
    Close bool
    Host string
    Form url.Values
    PostForm url.Values
    MultipartForm *multipart.Form
  ....
    ctx context.Context
}

从request结构可以看到,http请求的基本信息都囊括了。对于请求而言,主要关注一下请求的URL,Method,Header,Body这些结构。

header也是HTTP中重要的组成部分。Request结构中就有Header结构,Header本质上是一个map(map[string][]string)。将http协议的header的key-value进行映射成一个图:

Host: example.com
accept-encoding: gzip, deflate
Accept-Language: en-us
fOO: Bar
foo: two
    Header = map[string][]string{
        "Accept-Encoding": {"gzip, deflate"},
        "Accept-Language": {"en-us"},
        "Foo": {"Bar", "two"},
    }

header中的字段包含了很多通信的设置,很多时候请求都需要指定Content-Type。

func indexHandler(w http.ResponseWriter, r *http.Request) {
 
    info := fmt.Sprintln(r.Header.Get("Content-Type"))
    fmt.Fprintln(w, info)
}

☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded

Golng 提供了不少打印函数,基本上分为三类三种。即 Print Println 和Printf。
Print比较简单,打印输出到标准输出流,Println则也一样不同在于多打印一个换行符。至于Printf则是打印格式化字符串,三个方法都返回打印的bytes数。Sprint,Sprinln和Sprintf则返回打印的字符串,不会输出到标准流中。Fprint,Fprintf和Fprinln则把输出的结果打印输出到io.Writer接口中,http中则是http.ReponseWriter这个对象中,返回打印的bytes数。

Values

type Values map[string][]string
Values将建映射到值的列表。它一般用于查询的参数和表单的属性。不同于http.Header这个字典类型,Values的键是大小写敏感的。

Body

http中数据通信,主要通过body传输。go把body封装成Request的Body,它是一个ReadCloser接口。接口方法Reader也是一个接口,后者有一个Read(p []byte) (n int, err error)方法,因此body可以通过读取byte数组获取请求的数据。

func indexHandler(w http.ResponseWriter, r *http.Request) {

    info := fmt.Sprintln(r.Header.Get("Content-Type"))
    len := r.ContentLength
    body := make([]byte, len)
    r.Body.Read(body)
    fmt.Fprintln(w, info, string(body))
}

☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
name=vanyar&age=27

可见,当请求的content-type为application/x-www-form-urlencoded, body也是和query一样的格式,key-value的键值对。换成json的请求方式则如下:

☁ ~ curl -X POST -H "Content-Type: application/json" -d '{name: "vanyar", age: 27}' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/json
{name: "vanyar", age: 27}

multipart/form-data的格式用来上传图片,请求的body如下:

☁ ~ curl -X POST -H "Content-Type: multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW" -F "name=vanyar" -F "age=27" "http://127.0.0.1:8000?lang=zh&version=1.1.0"
multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW; boundary=------------------------d07972c7800e4c23
--------------------------d07972c7800e4c23
Content-Disposition: form-data; name="name"

vanyar
--------------------------d07972c7800e4c23
Content-Disposition: form-data; name="age"

27
--------------------------d07972c7800e4c23--

FORM表单

解析body可以读取客户端请求的数据。而这个数据是无论是键值对还是form-data数据,都比较原始。直接读取解析还是挺麻烦的。这些body数据通常也是表单提供。因此go提供处理这些表单数据的方法。
Form

go提供了ParseForm方法用来解析表单提供的数据,即content-type 为 x-www-form-urlencode的数据。

func indexHandler(w http.ResponseWriter, r *http.Request) {

contentType := fmt.Sprintln(r.Header.Get("Content-Type"))

r.ParseForm()
fromData := fmt.Sprintf("%#v", r.Form)
fmt.Fprintf(w, contentType, fromData)

}

☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
%!(EXTRA string=url.Values{"name":[]string{"vanyar"}, "age":[]string{"27"}, "lang":[]string{"zh"}, "version":[]string{"1.1.0"}})%

用来读取数据的结构和方法大致有下面几个:

fmt.Println(r.Form["lang"])
fmt.Println(r.PostForm["lang"])
fmt.Println(r.FormValue("lang"))
fmt.Println(r.PostFormValue("lang"))

其中r.Form和r.PostForm必须在调用ParseForm之后,才会有数据,否则则是空数组。
而r.FormValue和r.PostFormValue("lang")无需ParseForm的调用就能读取数据。

此外r.Form和r.PostForm都是数组结构,对于body和url都存在的同名参数,r.Form会有两个值,即 ["en", "zh"],而带POST前缀的数组和方法,都只能读取body的数据。

☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27&lang=en' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
%!(EXTRA string=url.Values{"version":[]string{"1.1.0"}, "name":[]string{"vanyar"}, "age":[]string{"27"}, "lang":[]string{"en", "zh"}})%

此时可以看到,lang参数不仅url的query提供了,post的body也提供了,go默认以body的数据优先,两者的数据都有,并不会覆盖。

如果不想读取url的参数,调用PostForm或PostFormValue读取字段的值即可。

r.PostForm["lang"][0]
r.PostFormValue["lang"]

对于form-data的格式的数据,ParseForm的方法只会解析url中的参数,并不会解析body中的参数。

☁ ~ curl -X POST -H "Content-Type: multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW" -F "name=vanyar" -F "age=27" -F "lang=en" "http://127.0.0.1:8000?lang=zh&version=1.1.0"
multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW; boundary=------------------------5f87d5bfa764488d
%!(EXTRA string=url.Values{"lang":[]string{"zh"}, "version":[]string{"1.1.0"}}
)%

因此当请求的content-type为form-data的时候,ParseFrom则需要改成 MutilpartFrom,否则r.From是读取不到body的内容,只能读取到query string中的内容。
MutilpartFrom

ParseMutilpartFrom方法需要提供一个读取数据长度的参数,然后使用同样的方法读取表单数据,MutilpartFrom只会读取body的数据,不会读取url的query数据。

func indexHandler(w http.ResponseWriter, r *http.Request) {

r.ParseMultipartForm(1024)

fmt.Println(r.Form["lang"])
fmt.Println(r.PostForm["lang"])
fmt.Println(r.FormValue("lang"))
fmt.Println(r.PostFormValue("lang"))
fmt.Println(r.MultipartForm.Value["lang"])

fmt.Fprintln(w, r.MultipartForm.Value)

}

可以看到请求之后返回 map[name:[vanyar] age:[27] lang:[en]]。即r.MultipartForm.Value并没有url中的参数。

总结一下,读取urlencode的编码方式,只需要ParseForm即可,读取form-data编码需要使用ParseMultipartForm方法。如果参数中既有url,又有body,From和FromValue方法都能读取。而带Post前缀的方法,只能读取body的数据内容。其中MultipartForm的数据通过r.MultipartForm.Value访问得到。
文件上传

form-data格式用得最多方式就是在图片上传的时候。r.MultipartForm.Value是post的body字段数据,r.MultipartForm.File则包含了图片数据:

func indexHandler(w http.ResponseWriter, r *http.Request) {

r.ParseMultipartForm(1024)
fileHeader := r.MultipartForm.File["file"][0]
fmt.Println(fileHeader)
file, err := fileHeader.Open()
if err == nil{
    data, err := ioutil.ReadAll(file)
    if err == nil{
        fmt.Println(len(data))
        fmt.Fprintln(w, string(data))
    }
}
fmt.Println(err)

}

发出请求之后,可以看见返回了图片。当然,go提供了更好的工具函数r.FormFile,直接读取上传文件数据。而不需要再使用 ParseMultipartForm 方法。

file, _, err := r.FormFile("file")

if err == nil{
    data, err := ioutil.ReadAll(file)
    if err == nil{
        fmt.Println(len(data))
        fmt.Fprintln(w, string(data))
    }
}
fmt.Println(err)

这种情况只适用于出了文件字段没有其他字段的时候,如果仍然需要读取lang参数,还是需要加上 ParseMultipartForm 调用的。读取到了上传文件,接下来就是很普通的写文件的io操作了。

JSON

现在流行前后端分离,客户端兴起了一些框架,angular,vue,react等提交的数据,通常习惯为json的格式。对于json格式,body就是原生的json字串。也就是go解密json为go的数据结构。

type Person struct {

Name string
Age int

}

func indexHandler(w http.ResponseWriter, r *http.Request) {

decode := json.NewDecoder(r.Body)
var p Person
err := decode.Decode(&p)
if err != nil{
    log.Fatalln(err)
}
info := fmt.Sprintf("%T\n%#v\n", p, p)
fmt.Fprintln(w, info)

}

☁ ~ curl -X POST -H "Content-Type: application/json" -d '{"name": "vanyar", "age": 27 }' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
main.Person
main.Person{Name:"vanyar", Age:27}

更多关于json的细节,以后再做讨论。访问官网文档获取更多的信息。
Response

请求和响应是http的孪生兄弟,不仅它们的报文格式类似,相关的处理和构造也类似。go构造响应的结构是ResponseWriter接口。

type ResponseWriter interface {

Header() Header
Write([]byte) (int, error)
WriteHeader(int)

}

里面的方法也很简单,Header方法返回一个header的map结构。WriteHeader则会返回响应的状态码。Write返回给客户端的数据。

我们已经使用了fmt.Fprintln 方法,直接向w写入响应的数据。也可以调用Write方法返回的字符。

func indexHandler(w http.ResponseWriter, r *http.Request) {

str := `<html>

Go Web Programming

Hello World


`
w.Write([]byte(str))

}

☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 200 OK
Date: Wed, 07 Dec 2016 09:13:04 GMT
Content-Length: 95
Content-Type: text/html; charset=utf-8


Go Web Programming

Hello World


% ☁ ~

go根据返回的字符,自动修改成了text/html的Content-Type格式。返回数据自定义通常需要修改header相关信息。

func indexHandler(w http.ResponseWriter, r *http.Request) {

w.WriteHeader(501)
fmt.Fprintln(w, "No such service, try next door")

}

☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 501 Not Implemented
Date: Wed, 07 Dec 2016 09:14:58 GMT
Content-Length: 31
Content-Type: text/plain; charset=utf-8

No such service, try next door

重定向

重定向的功能可以更加设置header的location和http状态码实现。

func indexHandler(w http.ResponseWriter, r *http.Request) {

w.Header().Set("Location", "https://google.com")
w.WriteHeader(302)

}

☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 302 Found
Location: https://google.com
Date: Wed, 07 Dec 2016 09:20:19 GMT
Content-Length: 31
Content-Type: text/plain; charset=utf-8

重定向是常用的功能,因此go也提供了工具方法,http.Redirect(w, r, "https://google.com", http.StatusFound)。

与请求的Header结构一样,w.Header也有几个方法用来设置headers

func (h Header) Add(key, value string) {

textproto.MIMEHeader(h).Add(key, value)

}

func (h Header) Set(key, value string) {

textproto.MIMEHeader(h).Set(key, value)

}

func (h MIMEHeader) Add(key, value string) {

key = CanonicalMIMEHeaderKey(key)
h[key] = append(h[key], value)

}

func (h MIMEHeader) Set(key, value string) {

h[CanonicalMIMEHeaderKey(key)] = []string{value}

}

Set和Add方法都可以设置headers,对于已经存在的key,Add会追加一个值value的数组中,,set则是直接替换value的值。即 append和赋值的差别。
Json

请求发送的数据可以是JSON,同样响应的数据也可以是json。restful风格的api也是返回json格式的数据。对于请求是解码json字串,响应则是编码json字串,go提供了标准库 encoding/json

type Post struct {

User string
Threads []string

}

func indexHandler(w http.ResponseWriter, r *http.Request) {

w.Header().Set("Content-Type", "application/json")
post := &Post{
    User: "vanyar",
    Threads: []string{"first", "second", "third"},
}
json, _ := json.Marshal(post)
w.Write(json)

}

☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 200 OK
Content-Type: application/json
Date: Thu, 08 Dec 2016 06:45:17 GMT
Content-Length: 54

{"User":"vanyar","Threads":["first","second","third"]}%

当然,更多的json处理细节稍后再做介绍。
总结

对于web应用程式,处理请求,返回响应是基本的内容。golang很好的封装了Request和ReponseWriter给开发者。无论是请求还是响应,都是针对url,header和body相关数据的处理。也是http协议的基本内容。

除了body的数据处理,有时候也需要处理header中的数据,一个常见的例子就是处理cookie。这将会在cookie的话题中讨论。

作者:人世间
链接:https://www.jianshu.com/p/f95558a49e98

`