純C語言實現的HTML5解析庫:Gumbo
Google開源的一款用C語言實現的HTML5解析庫Gumbo,作為一款純C99庫,Gumbo解析時無需任何外部依賴。它主要是用來成為其他工具或庫的一個構建塊,如linters、驗證器、模板語言、重構和分析工具。
目標及特征:
- 完全符合HTML5規范
- 強大,并且對于一些有問題的代碼,能夠靈活、有彈性地處理
- 簡單的API,可以很容易地與其他語言捆綁
- 支持源位置和指針回到原始文本
- 輕巧、沒有外部依賴
- 通過所有的html5lib-0.95測試
-
已在超過25億個來自谷歌索引的頁面中進行過測試
示例代碼:
#include "gumbo.h" int main(int argc, char** argv) { GumboOutput* output = gumbo_parse(argv[1]); // Do stuff with output->root gumbo_destroy_output(&kGumboDefaultOptions, output); }
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!