python去除html標簽

ybw8 9年前發布 | 860 次閱讀 Python

python去除html標簽,自己寫的,若有不足請指正:

#! /usr/bin/env python

coding=utf-8

blueel 2013-01-19

from HTMLParser import HTMLParser

class MLStripper(HTMLParser): def init(self): self.reset() self.fed = [] def handle_data(self, d): self.fed.append(d) def get_data(self): return ''.join(self.fed)

def strip_tags(html): s = MLStripper() s.feed(html) return s.get_data()</pre>

 本文由用戶 ybw8 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!