用Ruby編寫的XML/HTML解析器:Oga

jopen 10年前發布 | 43K 次閱讀 Oga HTML操作類庫

Oga是一個采用Ruby編寫的XML/HTML解析器。它提供了一個易于使用的API來解析,修改和查詢文檔(使用XPath表達式)。Oga不需要系統庫如libxml,使得它能夠更簡便和更快的安裝在各種平臺上。為了達到更好的性能Oga使用一個很小,原生擴展(C for MRI/Rubinius, Java for JRuby)。

handle = File.open('path/to/file.xml')
parser = Oga::XML::PullParser.new(handle)

parser.parse do |node|
  parser.on(:text) do
    puts node.text
  end
end

特性

  • Support for parsing XML and HTML(5)
    • DOM parsing
    • Stream/pull parsing
    • SAX parsing
  • Low memory footprint
  • High performance, if something doesn't perform well enough it's a bug
  • Support for XPath 1.0
  • CSS3 selector support
  • XML namespace support (registering, querying, etc)

項目主頁:http://www.baiduhome.net/lib/view/home/1417503470936

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!