Go 語言小帖士(一):io 包

knvz1997 8年前發布 | 14K 次閱讀 IO Go語言 Google Go/Golang開發

Go語言作為定位服務端編程的語言,處理文件和網絡通訊是它主要的應用場景,不論是處理文件還是處理網絡通訊,它們都被稱之為IO編程,即-對計算機的輸入輸出設備進行編程。

Go的運行時有一個名叫io的包,從命名可想而知它在Go語言的實際應用中有多么重要的地位,Go語言的所有IO編程都繞不過這一個包。

所以正確的理解這個包,在Go語言的工程實踐中是非常重要的,不論你是準備用Go語言處理文件還是處理網絡通訊,請務必先看這個包。

io包中大部分是接口定義,其中`io.Reader`和`io.Writer`最為關鍵。在Go語言中,文件、套接字等一切輸入設備抽象,都會實現`io.Reader`接口,而一切輸出設備抽象,都會實現`io.Writer`接口。

`io.Reader`的定義如下:

type Reader interface {
        Read(p []byte) (n int, err error)
}

其中文檔的說明非常重要,文檔中詳細描述了`Read`方法的各種返回可能性。

文檔描述中有一個要點,就是`n`可能小于等于`len(p)`,也就是說Go在讀IO的時候,是不會保證一次讀取預期的所有數據的。

如果我們要確保一次讀取我們所需的所有數據,就需要在一個循環里調用`Read`,累加每次返回的`n`并小心設置下次`Read`時`p`的偏移量,直到`n`的累加值達到我們的預期。

因為上述需求實在太常見了,所以Go在io包中提供了一個`ReadFull`函數來做到一次讀取要求的所有數據,通過閱讀`ReadFull`函數的代碼,也可以反過來幫助大家理解`io.Reader`是怎么運作的。

我們稍微跳躍一下,看一下`net`包中的`Conn`接口,`net.Conn`接口的第一個方法就是`Read`,方法簽名跟`io.Reader`接口要求的一樣。

要做好Go語言的網絡編程,在理解`net.Conn`之前,先得理解`io.Reader`,否則該用`io.ReadFull`的地方沒有用,就可能出現奇怪的協議解析錯誤,并且很難排查。

這就是我說`io.Reader`很重要的原因。

接著我們再看`io.Writer`接口:

type Writer interface {
        Write(p []byte) (n int, err error)
}

文檔中最關鍵的信息是:如果`n`小于`len(p)`,`err`必須不為`nil`。

也就是說`io.Writer`在每次寫數據時,要保證數據的完整寫入,這個特性跟`io.Reader`正好是相反的。

基于`io.Writer`的這一特性,我們可以推斷,當我們往一個`net.Conn`寫入數據時(是的,它當然也實現了這個接口),調用會阻塞直到數據完整寫完或者發生IO錯誤,這甚至不需要我們閱讀任何Go的底層代碼就可以做出這個判斷,如果你去閱讀`net`包和`runtime`包的底層代碼,可以進一步確認這個事實。

基于這個事實,我們在設計網絡應用或其它IO應用的時候就要小心我們的應用場景中IO阻塞是否是可接受的,如果IO阻塞會影響到業務處理,那我們就需要想辦法讓IO變成異步行為。

Go語言中要讓一個事情變成異步很簡單,舉個例子:

type Session struct {
        conn     net.Conn
        sendChan chan []byte
}

func NewSession(conn net.Conn, sendChanSize int) *Session {
        s := &Session{
                conn:     conn,
                sendChan: make(chan []byte, sendChanSize),
        }
        go s.sendLoop()
        return s
}

func (s *Session) sendLoop() {
        for {
                p := <-s.sendChan
                _, err := s.conn.Write(p)
                if err != nil {
                        return
                }
        }
}

func (s *Session) Send(p []byte) error {
        select {
        case s.sendChan <- p:
        default:
                return errors.New("Send Chan Blocked!")
        }
        return nil
}

以上代碼是利用Goroutine和chan來實現異步發送消息,Go的chan在緩沖區滿之前是不會阻塞的,緩沖區滿了再繼續往里寫就會阻塞。

為了防止極端情況下chan的緩沖區滿發生阻塞影響到業務,我們利用select語法的特性來做到不阻塞并返回錯誤。

io包除了`io.Reader`和`io.Writer`外,還有很多很有用的內容,比如`io.Copy`,通過閱讀底層實現代碼,你會發現`io.Copy`不僅僅是簡單的從一個`io.Reader`讀區數據寫入`io.Writer`,當要通過`net.Conn`發送一個文件時,它其實會利用Linux的`SendFile`機制做到零拷貝。

這篇文章沒辦法一一例舉和說明io包的所有內容,也無法代替包的文檔,請大家務必要自己仔細閱讀包的文檔(其實文檔第二段就非常關鍵,不要假定這些調用是線程安全的)。

 

來自: https://zhuanlan.zhihu.com/p/21360811

 

 本文由用戶 knvz1997 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!