python數據格式化之pprint
pprint – 美觀打印作用:美觀打印數據結構pprint 包含一個“美觀打印機”,用于生成數據結構的一個美觀視圖。格式化工具會生成數據結構
pprint – 美觀打印
作用:美觀打印數據結構
pprint 包含一個“美觀打印機”,用于生成數據結構的一個美觀視圖。格式化工具會生成數據結構的一些表示,不僅可以由解釋器正確地解析,而且便于人類閱讀。輸出盡可能放在一行上,分解為多行時則需要縮進。
以下實例用用到的data包含一下數據
data = [(1,{'a':'A','b':'B','c':'C','d':'D'}),
(2,{'e':'E','f':'F','g':'G','h':'H',
'i':'I','j':'J','k':'K','l':'L'
}),
]
1、 打印
要使用這個模塊,最簡單的方法就是利用pprint()函數
from pprint import pprint print 'PRINT:' print data print print 'PPRINT:' pprint(data)
運行結果:
PRINT:
[(1, {'a': 'A', 'c': 'C', 'b': 'B', 'd': 'D'}), (2, {'e': 'E', 'g': 'G', 'f': 'F', 'i': 'I', 'h': 'H', 'k': 'K', 'j': 'J', 'l': 'L'})]
PPRINT:
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
(2,
{'e': 'E',
'f': 'F',
'g': 'G',
'h': 'H',
'i': 'I',
'j': 'J',
'k': 'K',
'l': 'L'})] pprint()格式化一個對象,并把它寫至一個數據流,這個數據流作為參數傳入(或者是默認的sys.stdout)
注意為什么第二個字典中會顯示一豎列,因為pprint打印支持8個對象以上的豎列打印
2、 格式化
格式化一個數據結構而不把它直接寫至一個流(例如用于日志記錄),可以使用pformat()來構造一個字符串表示。
import logging
from pprint import pformat
logging.basicConfig(level = logging.DEBUG,
format = '%(levelname)-8s %(message)s',
)
logging.debug('Logging pformatted data')
formatted = pformat(data)
for line in formatted.splitlines():
logging.debug(line.rstrip()) 運行結果:
DEBUG Logging pformatted data
DEBUG [(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
DEBUG (2,
DEBUG {'e': 'E',
DEBUG 'f': 'F',
DEBUG 'g': 'G',
DEBUG 'h': 'H',
DEBUG 'i': 'I',
DEBUG 'j': 'J',
DEBUG 'k': 'K',
DEBUG 'l': 'L'})] 然后可以單獨低打印格式化的字符串或者計入日志
splitlines() 按行分割()
rstrip()去除右邊的空格 lstrip()去除左邊的空格 strip()去除兩邊空格。默認為去除空格,也可以傳入需要從兩邊或者其中一邊去除的字符,如strip(‘a’)就是去除字符串兩邊的字符’a’
3、 任意類
如果定制類定義了一個__repr__()方法,pprint()使用的PrettyPrinter類還可以處理這些定制類。
from pprint import pprint
class node(object):
def __init__(self,name,contents =[]):
self.name = name
self.contents = contents[:]
def __repr__(self):
return ('node(' + repr(self.name) + ',' +
repr(self.contents) + ')'
)
trees = [node('node-1'),
node('node-2',[node('node-2-1')]),
node('node-3',[node('node-3-1')]),
]
pprint(trees) 運行結果:
[node('node-1',[]),
node('node-2',[node('node-2-1',[])]),
node('node-3',[node('node-3-1',[])])] 由PrettyPrinter組合嵌套對象的表示,從而返回完整字符串表示。
4、 遞歸
遞歸數據結構有指向原數據源的引用來表示,形式為<Recursion on typename with id=number>。
from pprint import pprint local_data = ['a','b',1,2] local_data.append(local_data) print 'id(local_data) =>',id(local_data) pprint(local_data) print local_data
運行結果:
id(local_data) => 47458332363520 ['a', 'b', 1, 2, <Recursion on list with id=47458332363520>] ['a', 'b', 1, 2, [...]]
在這個例子中,列表local_data增加到了其自身,這會創建一個遞歸引用
內置函數id()作用是獲得對象的id值,理論上講每個對象都有一個id值,如果是整數和字符串((相對較小的時候)),那么相同的值會有相同的id值,但是如果是類,及時相同也會有不同的id值。測試如下:
#int or float or lon 都一樣(比較小的時候) a = 65464131311513l b = 65464131311513l c = 65464131311513l print id(a) print id(b) print id(c) print a = '12312312' b = '12312312' c = '12312312' print id(a) print id(b) print id(c) print a = 65464131311513l*11 b = 65464131311513l*11 c = 65464131311513l*11 print id(a) print id(b) print id(c) print a = '12312312'*11 b = '12312312'*11 c = '12312312'*11 print id(a) print id(b) print id(c) print class Test(object): def __init__(self): pass a = Test() b = Test() c = Test() print id(a) print id(b) print id(c) print
測試結果:
47010342174992
47010342174992
47010342174992
47010343272096
47010343272096
47010343272096
47010343261568
47010343261648
47010343261688
47010343200944
47010343199152
47010343202352
47010343252304
47010343252944
47010343253008
5、 限制嵌套輸出
對于非常深的數據結構,可能不要求輸出包含所有細節。有可能數據沒有是當地格式化,也可能格式化文本過大而無法管理,或者默寫數據時多余的。
from pprint import pprint print 'depth 1 :' pprint(data,depth=1) print print 'depth 2 :' pprint(data,depth=2) print print 'depth 3 :' pprint(data,depth=3)
運行結果:
depth 1 :
[(...), (...)]
depth 2 :
[(1, {...}), (2, {...})]
depth 3 :
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
(2,
{'e': 'E',
'f': 'F',
'g': 'G',
'h': 'H',
'i': 'I',
'j': 'J',
'k': 'K',
'l': 'L'})] 使用depth參數可以控制美觀打印機遞歸處理嵌套數據結構的深度。輸出中未包含的層次由一個省略號表示
6、 控制輸出寬度
格式化文本的默認輸出寬度為80列。要調整這個寬度,可以再pprint()中使用參數width。
from pprint import pprint for width in [80,5]: print 'WIDTH = ', width pprint(data,width = width) print
運行結果:
WIDTH = 80
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
(2,
{'e': 'E',
'f': 'F',
'g': 'G',
'h': 'H',
'i': 'I',
'j': 'J',
'k': 'K',
'l': 'L'})]
WIDTH = 5
[(1,
{'a': 'A',
'b': 'B',
'c': 'C',
'd': 'D'}),
(2,
{'e': 'E',
'f': 'F',
'g': 'G',
'h': 'H',
'i': 'I',
'j': 'J',
'k': 'K',
'l': 'L'})] 寬度大小不能適應格式化數據結構時,如果斬斷或轉行會引入非法的語法,就不會進行截斷或轉行。