jsoup v1.9.2 發布

jopen 8年前發布 | 8K 次閱讀 jsoup Java HTML

簡介

jsoup 是一款 Java 的HTML 解析器,可直接解析某個URL地址、HTML文本內容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于JQuery的操作方法來取出和操作數據。

jsoup的主要功能如下:

  • 從一個URL,文件或字符串中解析HTML;
  • 使用DOM或CSS選擇器來查找、取出數據;
  • 可操作HTML元素、屬性、文本;
  • jsoup是基于MIT協議發布的,可放心使用于商業項目。

更新日志

  • Fixed an issue where tag names that contained non-ascii characters but started with an ascii character 
    would cause the parser to get stuck in an infinite loop. 704
  • In XML documents, detect the charset from the XML prolog - <?xml encoding="UTF-8"?> 701
  • Fixed an issue where created XML documents would have an incorrect prolog. 652
  • Fixed an issue where you could not use an attribute selector to find values containing unbalanced braces or parentheses. 611
  • Fixed an issue where namespaced tags (like <fb:comment>) would cause Element.cssSelector() to fail. 677

下載地址

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!