trim-html:NodeJS的HTML文本截取庫(自動生成正文摘要)

n7w77 9年前發布 | 27K 次閱讀 trim-html Node.js 開發

原文  http://ourjs.com/detail/550a49521e8c708516000008

trim-html

可以截取HTML字符串,并不破壞打斷HTML標簽。

注* 網站內容大多基于HTML文本,傳統的字符串截取會破壞HTML標簽的結構,此庫對于自動生成網站內容摘要十分有幫助。

安裝

npm install trim-html

引用

var trimHtml = require('trim-html');

使用

var trimmed = trimHtml(html);

參數

  • limit 截取字符個數(默認為100)
  • preserveTags 去除HTML標簽(默認為false)
  • sufix  會加到后輟的字符串
  • moreLink 全文鏈接

示例

var html = '<div><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit,sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p><p>Utenim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquipex ea commodo consequat. </p><p>Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. </p><p>Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.</p></div>';

var trim = trimHtml(html, { limit: 200 });

// 返回對象 { html: '<div><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p><p>Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut... </p></div>', more: true // 標識是否還有更多內容 }</pre>

項目地址: https://github.com/brankosekulic/trimHtml

</div> </div>

 本文由用戶 n7w77 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!