Go Http
URL
URL类型 代表一个解析后的URL(或者说,一个URL参照)。
URL基本格式如下:
scheme后不是冒号加双斜线的URL被解释为如下格式:scheme:opaque[?query][#fragment]
scheme://[userinfo@]host/path[?query][#fragment]
注意: Path
字段是以解码后的格式保存的,如/%47%6f%2f会变成/Go/。
这导致我们无法确定Path字段中的斜线是来自原始URL还是解码前的%2f。除非一个客户端必须使用其他程序/函数来解析原始URL或者重构原始URL,这个区别并不重要。
此时,
HTTP服务端可以查询 req.RequestURI
HTTP客户端可以使用 Opaque
URL{Host: "example.com", Opaque: "//example.com/Go%2f"}
代替{Host: "example.com", Path: "/Go/"}。
type URL struct {
Scheme string
Opaque string // 编码后的不透明数据
User *Userinfo // 用户名和密码信息
Host string // host或host:port
Path string
RawQuery string // 编码后的查询字符串,不包含'?' [?query]
Fragment string // 引用的片段(文档位置),没有'#' [#fragment]
}
URL的格式比较明确,其实更好的名词应该是URI,统一资源定位。
URL中比较重要的是查询字符串query。通常作为get请求的参数。query是一些使用&符号分割的key1=value1&key2=value2键值对,由于url编码是ASSIC码,因此query需要进行urlencode。
Server端可以通过request.URI.RawQuery
读取query
func indexHandler(w http.ResponseWriter, r *http.Request) {
info := fmt.Sprintln(
"URL", r.URL,
"HOST", r.Host,
"Method", r.Method,
"RequestURL", r.RequestURI,
"RawQuery", r.URL.RawQuery)
fmt.Fprintln(w, info)
}
☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
URL /?lang=zh&version=1.1.0
HOST 127.0.0.1:8000
Method POST
RequestURL /?lang=zh&version=1.1.0
RawQuery lang=zh&version=1.1.0
func main() {
// 假设该URL没有#fragment后缀
values, err := url.ParseRequestURI("https://www.baidu.com/s?wd=%E6%90%9C%E7%B4%A2&rsv_spt=1&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=1&rsv_sug3=7&rsv_sug1=6")
fmt.Println(values)
u, err := url.Parse("http://admin:Passw0d@bing.com/search/!()*[]<>?q=!()*;[]<>$&+=:#home")
if err != nil {
log.Fatal(err)
}
fmt.Println(url.PathEscape(u.RawPath)) // %2Fsearch%2F%21%28%29%2A%5B%5D%3C%3E
fmt.Println(url.PathUnescape(u.RawPath)) // /search/!()*[]<> <nil>
fmt.Println(url.QueryEscape(u.RawQuery)) // q%3D%21%28%29%2A%3B%5B%5D%3C%3E%24%26%2B%3D%3A
fmt.Println(url.QueryUnescape(u.RawQuery)) // q=!()*;[]<>$& =: <nil>
fmt.Println(u) //http://bing.com/search/%21%28%29%2A%5B%5D%3C%3E?q=!()*;[]<>$&+=:#home
fmt.Println(u.User.String()) //admin:Passw0d
fmt.Println(u.User.Username()) //admin
fmt.Println(u.User.Password()) //Passw0d true
fmt.Println(u.Scheme) //http
fmt.Println(u.Opaque) //
fmt.Println(u.Host) //bing.com
fmt.Println(u.Hostname()) //bing.com
fmt.Println(u.Port()) //
fmt.Println(u.Path) ///search/!()*[]<>
fmt.Println(u.RawPath) ///search/!()*[]<>
fmt.Println(u.ForceQuery) // false
fmt.Println(u.RawQuery) //q=!()*;[]<>$&+=:
fmt.Println(u.Fragment) //home
fmt.Println(u)
u.RawQuery = u.Query().Encode()
}
Request 请求的结构
HTTP的交互以请求和响应的应答模式。go的请求我们早就见过了,handler函数的第二个参数http.Requests。其结构为:
type Request struct {
Method string
URL *url.URL
Proto string // "HTTP/1.0"
ProtoMajor int // 1
ProtoMinor int // 0
Header Header
Body io.ReadCloser
ContentLength int64
TransferEncoding []string
Close bool
Host string
Form url.Values
PostForm url.Values
MultipartForm *multipart.Form
....
ctx context.Context
}
从request结构可以看到,http请求的基本信息都囊括了。对于请求而言,主要关注一下请求的URL,Method,Header,Body这些结构。
header
header也是HTTP中重要的组成部分。Request结构中就有Header结构,Header本质上是一个map(map[string][]string)。将http协议的header的key-value进行映射成一个图:
Host: example.com
accept-encoding: gzip, deflate
Accept-Language: en-us
fOO: Bar
foo: two
Header = map[string][]string{
"Accept-Encoding": {"gzip, deflate"},
"Accept-Language": {"en-us"},
"Foo": {"Bar", "two"},
}
header中的字段包含了很多通信的设置,很多时候请求都需要指定Content-Type。
func indexHandler(w http.ResponseWriter, r *http.Request) {
info := fmt.Sprintln(r.Header.Get("Content-Type"))
fmt.Fprintln(w, info)
}
☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
Golng 提供了不少打印函数,基本上分为三类三种。即 Print Println 和Printf。
Print比较简单,打印输出到标准输出流,Println则也一样不同在于多打印一个换行符。至于Printf则是打印格式化字符串,三个方法都返回打印的bytes数。Sprint,Sprinln和Sprintf则返回打印的字符串,不会输出到标准流中。Fprint,Fprintf和Fprinln则把输出的结果打印输出到io.Writer接口中,http中则是http.ReponseWriter这个对象中,返回打印的bytes数。
Values
type Values map[string][]string
Values将建映射到值的列表。它一般用于查询的参数和表单的属性。不同于http.Header这个字典类型,Values的键是大小写敏感的。
Body
http中数据通信,主要通过body传输。go把body封装成Request的Body,它是一个ReadCloser接口。接口方法Reader也是一个接口,后者有一个Read(p []byte) (n int, err error)方法,因此body可以通过读取byte数组获取请求的数据。
func indexHandler(w http.ResponseWriter, r *http.Request) {
info := fmt.Sprintln(r.Header.Get("Content-Type"))
len := r.ContentLength
body := make([]byte, len)
r.Body.Read(body)
fmt.Fprintln(w, info, string(body))
}
☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
name=vanyar&age=27
可见,当请求的content-type为application/x-www-form-urlencoded, body也是和query一样的格式,key-value的键值对。换成json的请求方式则如下:
☁ ~ curl -X POST -H "Content-Type: application/json" -d '{name: "vanyar", age: 27}' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/json
{name: "vanyar", age: 27}
multipart/form-data的格式用来上传图片,请求的body如下:
☁ ~ curl -X POST -H "Content-Type: multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW" -F "name=vanyar" -F "age=27" "http://127.0.0.1:8000?lang=zh&version=1.1.0"
multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW; boundary=------------------------d07972c7800e4c23
--------------------------d07972c7800e4c23
Content-Disposition: form-data; name="name"
vanyar
--------------------------d07972c7800e4c23
Content-Disposition: form-data; name="age"
27
--------------------------d07972c7800e4c23--
FORM表单
解析body可以读取客户端请求的数据。而这个数据是无论是键值对还是form-data数据,都比较原始。直接读取解析还是挺麻烦的。这些body数据通常也是表单提供。因此go提供处理这些表单数据的方法。
Form
go提供了ParseForm方法用来解析表单提供的数据,即content-type 为 x-www-form-urlencode的数据。
func indexHandler(w http.ResponseWriter, r *http.Request) {
contentType := fmt.Sprintln(r.Header.Get("Content-Type"))
r.ParseForm()
fromData := fmt.Sprintf("%#v", r.Form)
fmt.Fprintf(w, contentType, fromData)
}
☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
%!(EXTRA string=url.Values{"name":[]string{"vanyar"}, "age":[]string{"27"}, "lang":[]string{"zh"}, "version":[]string{"1.1.0"}})%
用来读取数据的结构和方法大致有下面几个:
fmt.Println(r.Form["lang"])
fmt.Println(r.PostForm["lang"])
fmt.Println(r.FormValue("lang"))
fmt.Println(r.PostFormValue("lang"))
其中r.Form和r.PostForm必须在调用ParseForm之后,才会有数据,否则则是空数组。
而r.FormValue和r.PostFormValue("lang")无需ParseForm的调用就能读取数据。
此外r.Form和r.PostForm都是数组结构,对于body和url都存在的同名参数,r.Form会有两个值,即 ["en", "zh"],而带POST前缀的数组和方法,都只能读取body的数据。
☁ ~ curl -X POST -H "Content-Type: application/x-www-form-urlencoded" -d 'name=vanyar&age=27&lang=en' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
application/x-www-form-urlencoded
%!(EXTRA string=url.Values{"version":[]string{"1.1.0"}, "name":[]string{"vanyar"}, "age":[]string{"27"}, "lang":[]string{"en", "zh"}})%
此时可以看到,lang参数不仅url的query提供了,post的body也提供了,go默认以body的数据优先,两者的数据都有,并不会覆盖。
如果不想读取url的参数,调用PostForm或PostFormValue读取字段的值即可。
r.PostForm["lang"][0]
r.PostFormValue["lang"]
对于form-data的格式的数据,ParseForm的方法只会解析url中的参数,并不会解析body中的参数。
☁ ~ curl -X POST -H "Content-Type: multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW" -F "name=vanyar" -F "age=27" -F "lang=en" "http://127.0.0.1:8000?lang=zh&version=1.1.0"
multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW; boundary=------------------------5f87d5bfa764488d
%!(EXTRA string=url.Values{"lang":[]string{"zh"}, "version":[]string{"1.1.0"}}
)%
因此当请求的content-type为form-data的时候,ParseFrom则需要改成 MutilpartFrom,否则r.From是读取不到body的内容,只能读取到query string中的内容。
MutilpartFrom
ParseMutilpartFrom方法需要提供一个读取数据长度的参数,然后使用同样的方法读取表单数据,MutilpartFrom只会读取body的数据,不会读取url的query数据。
func indexHandler(w http.ResponseWriter, r *http.Request) {
r.ParseMultipartForm(1024)
fmt.Println(r.Form["lang"])
fmt.Println(r.PostForm["lang"])
fmt.Println(r.FormValue("lang"))
fmt.Println(r.PostFormValue("lang"))
fmt.Println(r.MultipartForm.Value["lang"])
fmt.Fprintln(w, r.MultipartForm.Value)
}
可以看到请求之后返回 map[name:[vanyar] age:[27] lang:[en]]。即r.MultipartForm.Value并没有url中的参数。
总结一下,读取urlencode的编码方式,只需要ParseForm即可,读取form-data编码需要使用ParseMultipartForm方法。如果参数中既有url,又有body,From和FromValue方法都能读取。而带Post前缀的方法,只能读取body的数据内容。其中MultipartForm的数据通过r.MultipartForm.Value访问得到。
文件上传
form-data格式用得最多方式就是在图片上传的时候。r.MultipartForm.Value是post的body字段数据,r.MultipartForm.File则包含了图片数据:
func indexHandler(w http.ResponseWriter, r *http.Request) {
r.ParseMultipartForm(1024)
fileHeader := r.MultipartForm.File["file"][0]
fmt.Println(fileHeader)
file, err := fileHeader.Open()
if err == nil{
data, err := ioutil.ReadAll(file)
if err == nil{
fmt.Println(len(data))
fmt.Fprintln(w, string(data))
}
}
fmt.Println(err)
}
发出请求之后,可以看见返回了图片。当然,go提供了更好的工具函数r.FormFile,直接读取上传文件数据。而不需要再使用 ParseMultipartForm 方法。
file, _, err := r.FormFile("file")
if err == nil{
data, err := ioutil.ReadAll(file)
if err == nil{
fmt.Println(len(data))
fmt.Fprintln(w, string(data))
}
}
fmt.Println(err)
这种情况只适用于出了文件字段没有其他字段的时候,如果仍然需要读取lang参数,还是需要加上 ParseMultipartForm 调用的。读取到了上传文件,接下来就是很普通的写文件的io操作了。
JSON
现在流行前后端分离,客户端兴起了一些框架,angular,vue,react等提交的数据,通常习惯为json的格式。对于json格式,body就是原生的json字串。也就是go解密json为go的数据结构。
type Person struct {
Name string
Age int
}
func indexHandler(w http.ResponseWriter, r *http.Request) {
decode := json.NewDecoder(r.Body)
var p Person
err := decode.Decode(&p)
if err != nil{
log.Fatalln(err)
}
info := fmt.Sprintf("%T\n%#v\n", p, p)
fmt.Fprintln(w, info)
}
☁ ~ curl -X POST -H "Content-Type: application/json" -d '{"name": "vanyar", "age": 27 }' "http://127.0.0.1:8000?lang=zh&version=1.1.0"
main.Person
main.Person{Name:"vanyar", Age:27}
更多关于json的细节,以后再做讨论。访问官网文档获取更多的信息。
Response
请求和响应是http的孪生兄弟,不仅它们的报文格式类似,相关的处理和构造也类似。go构造响应的结构是ResponseWriter接口。
type ResponseWriter interface {
Header() Header
Write([]byte) (int, error)
WriteHeader(int)
}
里面的方法也很简单,Header方法返回一个header的map结构。WriteHeader则会返回响应的状态码。Write返回给客户端的数据。
我们已经使用了fmt.Fprintln 方法,直接向w写入响应的数据。也可以调用Write方法返回的字符。
func indexHandler(w http.ResponseWriter, r *http.Request) {
str := `<html>
Hello World
`
w.Write([]byte(str))
}
☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 200 OK
Date: Wed, 07 Dec 2016 09:13:04 GMT
Content-Length: 95
Content-Type: text/html; charset=utf-8
Hello World
% ☁ ~
go根据返回的字符,自动修改成了text/html的Content-Type格式。返回数据自定义通常需要修改header相关信息。
func indexHandler(w http.ResponseWriter, r *http.Request) {
w.WriteHeader(501)
fmt.Fprintln(w, "No such service, try next door")
}
☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 501 Not Implemented
Date: Wed, 07 Dec 2016 09:14:58 GMT
Content-Length: 31
Content-Type: text/plain; charset=utf-8
No such service, try next door
重定向
重定向的功能可以更加设置header的location和http状态码实现。
func indexHandler(w http.ResponseWriter, r *http.Request) {
w.Header().Set("Location", "https://google.com")
w.WriteHeader(302)
}
☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 302 Found
Location: https://google.com
Date: Wed, 07 Dec 2016 09:20:19 GMT
Content-Length: 31
Content-Type: text/plain; charset=utf-8
重定向是常用的功能,因此go也提供了工具方法,http.Redirect(w, r, "https://google.com", http.StatusFound)。
与请求的Header结构一样,w.Header也有几个方法用来设置headers
func (h Header) Add(key, value string) {
textproto.MIMEHeader(h).Add(key, value)
}
func (h Header) Set(key, value string) {
textproto.MIMEHeader(h).Set(key, value)
}
func (h MIMEHeader) Add(key, value string) {
key = CanonicalMIMEHeaderKey(key)
h[key] = append(h[key], value)
}
func (h MIMEHeader) Set(key, value string) {
h[CanonicalMIMEHeaderKey(key)] = []string{value}
}
Set和Add方法都可以设置headers,对于已经存在的key,Add会追加一个值value的数组中,,set则是直接替换value的值。即 append和赋值的差别。
Json
请求发送的数据可以是JSON,同样响应的数据也可以是json。restful风格的api也是返回json格式的数据。对于请求是解码json字串,响应则是编码json字串,go提供了标准库 encoding/json
type Post struct {
User string
Threads []string
}
func indexHandler(w http.ResponseWriter, r *http.Request) {
w.Header().Set("Content-Type", "application/json")
post := &Post{
User: "vanyar",
Threads: []string{"first", "second", "third"},
}
json, _ := json.Marshal(post)
w.Write(json)
}
☁ ~ curl -i http://127.0.0.1:8000/
HTTP/1.1 200 OK
Content-Type: application/json
Date: Thu, 08 Dec 2016 06:45:17 GMT
Content-Length: 54
{"User":"vanyar","Threads":["first","second","third"]}%
当然,更多的json处理细节稍后再做介绍。
总结
对于web应用程式,处理请求,返回响应是基本的内容。golang很好的封装了Request和ReponseWriter给开发者。无论是请求还是响应,都是针对url,header和body相关数据的处理。也是http协议的基本内容。
除了body的数据处理,有时候也需要处理header中的数据,一个常见的例子就是处理cookie。这将会在cookie的话题中讨论。