PHP 用 tidy_parse_file() 函數提取 HTML 中的鏈接

nbnb 9年前發布 | 1K 次閱讀 PHP

<?php
      function dump_urls(tidy_node $node, &$urls = NULL) {
            $urls = (is_array($urls)) ? $urls : array();

        if(isset($node->id)) {
              if($node->id == TIDY_TAG_A) {
                    $urls[] = $node->attribute['href'];
              }
        }

        if($node->hasChildren()) {
              foreach($node->child as $child) {
                    dump_urls($child, $urls);
              }
        }
                   return $urls;
  }

  $tidy = tidy_parse_file("http://www.php.net/");
  $urls = dump_urls($tidy->body());
  print_r($urls);

?></pre>

 本文由用戶 nbnb 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!