python正則表達式提取網頁URL

pykde 10年前發布 | 2K 次閱讀 Python

python正則表達式提取網頁URL

import re
import urllib
url="http://www.baiduhome.net"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
print i
else:
print 'this is over'

本文由用戶 pykde 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/code/view/1434361037630

Python

python正則表達式提取網頁URL

相關代碼

相關文檔

相關經驗

目錄