基于DFA的敏感詞檢測和替換Python模塊 - SmallGFW
smallgfw: 一個基于DFA的敏感詞檢測和替換模塊,用法如doctest所示。
>>> gfw = GFW() >>> gfw.set(["sexy","girl","love","shit"])#設置敏感詞列表 >>> s = gfw.replace("shit!,Cherry is a sexy girl. She loves python.","*") >>> print s *!,Cherry is a * *. She *s python. #屏蔽后的效果 >>> gfw = GFW() >>> gfw.set(["abd","defz","bcz"]) >>> print gfw.check("xabdabczabdxaadefz") #檢測敏感詞的出現位置 [(1, 3, 'abd'), (5, 3, 'bcz'), (8, 3, 'abd'), (14, 4, 'defz')] #例如,(5, 3, 'bcz')表示下標5之后長度為3的子串
本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!