Base64編碼是怎么工作的?

jopen 11年前發布 | 32K 次閱讀 BASE64

1: 為什么需要base64?

ASCII碼一共規定了128個字符的編碼,這128個符號,范圍在[0,127]之間.
其中,[0,31],及127, 33個屬于不可打印的控制字符.

在電子郵件傳輸信息時,有些郵件網關會把[0,31]這些控制字符給悄悄清除.
還有的早期程序,收到[128,255]之間的國際字符時,甚至會發生錯誤.

如何在不同郵件網關之間安全的傳輸控制字符,國際字符,甚至二進制文件?
于是作為MIME多媒體電子郵件標準的一部分—base64被開發出來.

2: 一句話說完base64怎么工作的?

把N字節的內容對應的8*N位, 每6位砍成1段,得到 (8*N)/6 個單元,
每個單元的值,都在[0,63]之間,再把其值對應1個ascii字符,拼接起來,OK!

base64_encode(’PHP’) ==> ‘UEhQ’, 編碼過程如下:

Base64編碼是怎么工作的?

3: 如果每6位砍成1段,但不能整除,余下2個位或4位怎么辦?

用”0″來補至6位, 并再次轉化為”base64字符表”中的某個字符.

然后,再用”=”字符當做6個位,繼續填充,直至總位數能被8帶整除.

字符串 二進制序列(紅字為填充位) 編碼結果
PHP 010100 000100 100001 010000 UEhQ
it 011010 010111 0100

00 xxxxxx

aXQ=
bool 011000 100110 111101 101111 011011 00

0000 xxxxxx xxxxxx

Ym9vbA==

4:base64表示圖片

通過上面的演示,可以看出,base64也可以編碼二進制文件,如郵件中的圖片和附件.
編碼后,我們可以在網頁或郵件的源碼里,直接體現此圖片,
而不必把圖片放在服務器上,引用其鏈接.

用例:base64(’abc.png’) ==> ‘encoded-result’;
則在網頁中, <img src=”data:image/png;base64,encoded-result” />

看到下面這個5角星了嗎? 右鍵看源碼,就會發現圖片是一串字符串 Base64編碼是怎么工作的?

5: base64編碼后字節的變化

很容易推算出, 編碼后,每6個位變成8個位.
因此,編碼后字節約比編碼前多33%.

6: base64串結尾的”=”可以去掉嗎?

從上面的編碼規則可以反推出, 在base64解碼的過程中, 要清除掉結尾處的等號,
然后再反查”base64索引與字母對照表”,轉換成原始的字節序列.

那么,去掉尾部的等號,并沒有丟失原始信息,但結構變得不規范.
解碼前是否判斷完整性,這取決于你的應用程序.

實測PHP中的base64_decode函數,并不檢測尾部的等號是否完整.

來自:http://www.yanshiba.com/archives/638

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!