Python編碼介紹——encode和decode

jopen 9年前發布 | 13K 次閱讀 Python Python開發

在 python 源代碼文件中,如果你有用到非ASCII字符,則需要在文件頭部進行字符編碼的聲明,聲明如下:

  1. # code: UTF-8
  2. </ol> </div>
    因為python 只檢查 #、coding 和編碼字符串,所以你可能回見到下面的聲明方式,這是有些人為了美觀等原因才這樣寫的:

    1. #-*- codingUTF--*-
    2. </ol> </div>


      常見編碼介紹:

      </div>

      • GB2312編碼:適用于漢字處理、漢字通信等系統之間的信息交換
      • GBK編碼:是漢字編碼標準之一,是在 GB2312-80 標準基礎上的內碼擴展規范,使用了雙字節編碼
      • ASCII編碼:是對英語字符和二進制之間的關系做的統一規定
      • Unicode編碼:這是一種世界上所有字符的編碼。當然了它沒有規定的存儲方式。
      • UTF-8編碼:是 Unicode Transformation Format - 8 bit 的縮寫, UTF-8 是 Unicode 的一種實現方式。它是可變長的編碼方式,可以使用 1~4 個字節表示一個字符,可根據不同的符號而變化字節長度。
      • </ul>


        </div> </blockquote>

        編碼轉換:

        Python內部的字符串一般都是 Unicode編碼。代碼中字符串的默認編碼與代碼文件本身的編碼是一致的。所以要做一些編碼轉換通常是要以Unicode作為中間編碼進行轉換的,即先將其他編碼的字符串解碼(decode)成 Unicode,再從 Unicode編碼(encode)成另一種編碼。

        </div>