• 0推薦
    90K 瀏覽

    提取正文內容的Java類庫:BoilerPipe

    BoilerPipe是一個開源java類庫,能從html中剔除廣告和其他附加信息,提取出目標信息,如正文內容。可以通過配置不同的extractor來extract目標內容。
    jopen 10年前   

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色