用Python輸出漢字字庫

jopen 10年前發布 | 18K 次閱讀 Python Python開發

問題1:假設我們知道漢字編碼范圍是0x4E00到0x9FA5,怎么從十六進制的編碼轉成人類可讀的字呢?

問題2:怎么把unicode編碼的字寫入文件呢,如果直接用open()的話,會提示UnicodeEncodeError: 'ascii' codec can't encode character u'\u4e00' in position 0: ordinal not in range(128)

 

問題1的答案是用unichr,問題2的答案是用codes。

下面上代碼。

</div> </div>

    import codecs  
    start,end = (0x4E00, 0x9FA5)  
    with codecs.open("chinese.txt", "wb", encoding="utf-8") as f:  
        for codepoint in range(int(start),int(end)):  
            f.write(unichr(codepoint))  

 

打開chinese.txt文件,截圖如下
20140720100600625.png

來自:http://blog.csdn.net/handsomekang/article/details/37989215

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!