純C語言實現的HTML5解析庫:Gumbo

jopen 11年前發布 | 27K 次閱讀 Gumbo HTML5 前端技術

Google開源的一款用C語言實現的HTML5解析庫Gumbo,作為一款純C99庫,Gumbo解析時無需任何外部依賴。它主要是用來成為其他工具或庫的一個構建塊,如linters、驗證器、模板語言、重構和分析工具。

目標及特征:

  • 完全符合HTML5規范
  • 強大,并且對于一些有問題的代碼,能夠靈活、有彈性地處理
  • 簡單的API,可以很容易地與其他語言捆綁
  • 支持源位置和指針回到原始文本
  • 輕巧、沒有外部依賴
  • 通過所有的html5lib-0.95測試
  • 已在超過25億個來自谷歌索引的頁面中進行過測試

示例代碼:

#include "gumbo.h"

int main(int argc, char** argv) {
  GumboOutput* output = gumbo_parse(argv[1]);
  // Do stuff with output->root
  gumbo_destroy_output(&kGumboDefaultOptions, output);
}

項目主頁:http://www.baiduhome.net/lib/view/home/1376493434350

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!