Go 語言小帖士(一):io 包
Go語言作為定位服務端編程的語言,處理文件和網絡通訊是它主要的應用場景,不論是處理文件還是處理網絡通訊,它們都被稱之為IO編程,即-對計算機的輸入輸出設備進行編程。
Go的運行時有一個名叫io的包,從命名可想而知它在Go語言的實際應用中有多么重要的地位,Go語言的所有IO編程都繞不過這一個包。
所以正確的理解這個包,在Go語言的工程實踐中是非常重要的,不論你是準備用Go語言處理文件還是處理網絡通訊,請務必先看這個包。
io包中大部分是接口定義,其中`io.Reader`和`io.Writer`最為關鍵。在Go語言中,文件、套接字等一切輸入設備抽象,都會實現`io.Reader`接口,而一切輸出設備抽象,都會實現`io.Writer`接口。
`io.Reader`的定義如下:
type Reader interface {
Read(p []byte) (n int, err error)
}
其中文檔的說明非常重要,文檔中詳細描述了`Read`方法的各種返回可能性。
文檔描述中有一個要點,就是`n`可能小于等于`len(p)`,也就是說Go在讀IO的時候,是不會保證一次讀取預期的所有數據的。
如果我們要確保一次讀取我們所需的所有數據,就需要在一個循環里調用`Read`,累加每次返回的`n`并小心設置下次`Read`時`p`的偏移量,直到`n`的累加值達到我們的預期。
因為上述需求實在太常見了,所以Go在io包中提供了一個`ReadFull`函數來做到一次讀取要求的所有數據,通過閱讀`ReadFull`函數的代碼,也可以反過來幫助大家理解`io.Reader`是怎么運作的。
我們稍微跳躍一下,看一下`net`包中的`Conn`接口,`net.Conn`接口的第一個方法就是`Read`,方法簽名跟`io.Reader`接口要求的一樣。
要做好Go語言的網絡編程,在理解`net.Conn`之前,先得理解`io.Reader`,否則該用`io.ReadFull`的地方沒有用,就可能出現奇怪的協議解析錯誤,并且很難排查。
這就是我說`io.Reader`很重要的原因。
接著我們再看`io.Writer`接口:
type Writer interface {
Write(p []byte) (n int, err error)
}
文檔中最關鍵的信息是:如果`n`小于`len(p)`,`err`必須不為`nil`。
也就是說`io.Writer`在每次寫數據時,要保證數據的完整寫入,這個特性跟`io.Reader`正好是相反的。
基于`io.Writer`的這一特性,我們可以推斷,當我們往一個`net.Conn`寫入數據時(是的,它當然也實現了這個接口),調用會阻塞直到數據完整寫完或者發生IO錯誤,這甚至不需要我們閱讀任何Go的底層代碼就可以做出這個判斷,如果你去閱讀`net`包和`runtime`包的底層代碼,可以進一步確認這個事實。
基于這個事實,我們在設計網絡應用或其它IO應用的時候就要小心我們的應用場景中IO阻塞是否是可接受的,如果IO阻塞會影響到業務處理,那我們就需要想辦法讓IO變成異步行為。
Go語言中要讓一個事情變成異步很簡單,舉個例子:
type Session struct {
conn net.Conn
sendChan chan []byte
}
func NewSession(conn net.Conn, sendChanSize int) *Session {
s := &Session{
conn: conn,
sendChan: make(chan []byte, sendChanSize),
}
go s.sendLoop()
return s
}
func (s *Session) sendLoop() {
for {
p := <-s.sendChan
_, err := s.conn.Write(p)
if err != nil {
return
}
}
}
func (s *Session) Send(p []byte) error {
select {
case s.sendChan <- p:
default:
return errors.New("Send Chan Blocked!")
}
return nil
}
以上代碼是利用Goroutine和chan來實現異步發送消息,Go的chan在緩沖區滿之前是不會阻塞的,緩沖區滿了再繼續往里寫就會阻塞。
為了防止極端情況下chan的緩沖區滿發生阻塞影響到業務,我們利用select語法的特性來做到不阻塞并返回錯誤。
io包除了`io.Reader`和`io.Writer`外,還有很多很有用的內容,比如`io.Copy`,通過閱讀底層實現代碼,你會發現`io.Copy`不僅僅是簡單的從一個`io.Reader`讀區數據寫入`io.Writer`,當要通過`net.Conn`發送一個文件時,它其實會利用Linux的`SendFile`機制做到零拷貝。
這篇文章沒辦法一一例舉和說明io包的所有內容,也無法代替包的文檔,請大家務必要自己仔細閱讀包的文檔(其實文檔第二段就非常關鍵,不要假定這些調用是線程安全的)。
來自: https://zhuanlan.zhihu.com/p/21360811