詳解python文件讀寫操作

nf456 11年前發布 | 22K 次閱讀 Python開發 Python

1.open

使用open打開文件后一定要記得調用文件對象的close()方法。比如可以用try/finally語句來確保最后能關閉文件。

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

注：不能把open語句放在try塊里，因為當打開文件出現異常時，文件對象file_object無法執行close()方法。

2.讀文件

讀文本文件

input = open('data', 'r')

#第二個參數默認為r

input = open('data')

讀二進制文件

input = open('data', 'rb')

讀取所有內容

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

讀固定字節

file_object = open('abinfile', 'rb')

try:

while True:

chunk = file_object.read(100)

if not chunk:

break

do_something_with(chunk)

finally:

file_object.close( )

讀每行

list_of_all_the_lines = file_object.readlines( )

如果文件是文本文件，還可以直接遍歷文件對象獲取每行：

for line in file_object:

process line

3.寫文件

寫文本文件

output = open('data', 'w')

寫二進制文件

output = open('data', 'wb')

追加寫文件

output = open('data', 'w+')

寫數據

file_object = open('thefile.txt', 'w')

file_object.write(all_the_text)

file_object.close( )

寫入多行

file_object.writelines(list_of_text_strings)

注意，調用writelines寫入多行在性能上會比使用write一次性寫入要高。

在處理日志文件的時候，常常會遇到這樣的情況：日志文件巨大，不可能一次性把整個文件讀入到內存中進行處理，例如需要在一臺物理內存為 2GB 的機器上處理一個 2GB 的日志文件，我們可能希望每次只處理其中 200MB 的內容。

在 Python 中，內置的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼為例：

file = open('test.log', 'r')sizehint = 209715200 # 200Mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0: position = file.tell() lines = file.readlines(sizehint)

每次調用 readlines(sizehint) 函數，會返回大約 200MB 的數據，而且所返回的必然都是完整的行數據，大多數情況下，返回的數據的字節數會稍微比 sizehint 指定的值大一點（除最后一次調用 readlines(sizehint) 函數的時候）。通常情況下，Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

file在python是一個特殊的類型，它用于在python程序中對外部的文件進行操作。在python中一切都是對象，file也不例外，file有file的方法和屬性。下面先來看如何創建一個file對象：

file(name[, mode[, buffering]])

file()函數用于創建一個file對象，它有一個別名叫open()，可能更形象一些，它們是內置函數。來看看它的參數。它參數都是以字符串的形式傳遞的。name是文件的名字。

mode 是打開的模式，可選的值為r w a U，分別代表讀（默認）寫添加支持各種換行符的模式。用w或a模式打開文件的話，如果文件不存在，那么就自動創建。此外，用w模式打開一個已經存在的文件時，原有文件的內容會被清空，因為一開始文件的操作的標記是在文件的開頭的，這時候進行寫操作，無疑會把原有的內容給抹掉。由于歷史的原因，換行符在不同的系統中有不同模式，比如在 unix中是一個\n，而在windows中是‘\r\n’，用U模式打開文件，就是支持所有的換行模式，也就說‘\r’ '\n' '\r\n'都可表示換行，會有一個tuple用來存貯這個文件中用到過的換行符。不過，雖說換行有多種模式，讀到python中統一用\n代替。在模式字符的后面，還可以加上+ b t這兩種標識，分別表示可以對文件同時進行讀寫操作和用二進制模式、文本模式（默認）打開文件。

buffering如果為0表示不進行緩沖;如果為1表示進行“行緩沖“;如果是一個大于1的數表示緩沖區的大小，應該是以字節為單位的。

file對象有自己的屬性和方法。先來看看file的屬性。

closed #標記文件是否已經關閉，由close()改寫

encoding #文件編碼

mode #打開模式

name #文件名

newlines #文件中用到的換行模式，是一個tuple

softspace #boolean型，一般為0，據說用于print

file的讀寫方法：

F.read([size]) #size為讀取的長度，以byte為單位

F.readline([size])

#讀一行，如果定義了size，有可能返回的只是一行的一部分

F.readlines([size])

#把文件每一行作為一個list的一個成員，并返回這個list。其實它的內部是通過循環調用readline()來實現的。如果提供size參數，size是表示讀取內容的總長，也就是說可能只讀到文件的一部分。

F.write(str)

#把str寫到文件中，write()并不會在str后加上一個換行符

F.writelines(seq)

#把seq的內容全部寫到文件中。這個函數也只是忠實地寫入，不會在每行后面加上任何東西。

file的其他方法：

F.close()

#關閉文件。python會在一個文件不用后自動關閉文件，不過這一功能沒有保證，最好還是養成自己關閉的習慣。如果一個文件在關閉后還對其進行操作會產生ValueError

F.flush()

#把緩沖區的內容寫入硬盤

F.fileno()

#返回一個長整型的”文件標簽“

F.isatty()

#文件是否是一個終端設備文件（unix系統中的）

F.tell()

#返回文件操作標記的當前位置，以文件的開頭為原點

F.next()

#返回下一行，并將文件操作標記位移到下一行。把一個file用于for ... in file這樣的語句時，就是調用next()函數來實現遍歷的。

F.seek(offset[,whence])

# 將文件打操作標記移到offset的位置。這個offset一般是相對于文件的開頭來計算的，一般為正數。但如果提供了whence參數就不一定了，whence可以為0表示從頭開始計算，1表示以當前位置為原點計算。2表示以文件末尾為原點進行計算。需要注意，如果文件以a或a+的模式打開，每次進行寫操作時，文件操作標記會自動返回到文件末尾。

F.truncate([size])

#把文件裁成規定的大小，默認的是裁到當前文件操作標記的位置。如果size比文件的大小還要大，依據系統的不同可能是不改變文件，也可能是用0把文件補到相應的大小，也可能是以一些隨機的內容加上去。

本文由用戶 nf456 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1420378956062.html

Python開發 Python

詳解python文件讀寫操作

相關經驗

相關資訊

相關文檔

目錄