XPath 簡介

jopen 9年前發布 | 37K 次閱讀 XPath XML操作類庫

XPath 簡介

XPath 是一門在 XML 文檔中查找信息的語言。XPath 用于在 XML 文檔中通過元素和屬性進行導航。

在學習之前應該具備的知識:

在您繼續學習之前,應該對下面的知識有基本的了解:

·  HTML / XHTML

·  XML / XML 命名空間

如果您希望首先學習這些項目,請在我們的 首頁 訪問這些教程。

什么是 XPath?

·  XPath 使用路徑表達式在 XML 文檔中進行導航

·  XPath 包含一個標準函數庫

·  XPath XSLT 中的主要元素

·  XPath 是一個 W3C 標準

XPath 路徑表達式

XPath 使用路徑表達式來選取 XML 文檔中的節點或者節點集。這些路徑表達式和我們在常規的電腦文件系統中看到的表達式非常相似。

XPath 標準函數

XPath 含有超過 100 個內建的函數。這些函數用于字符串值、數值,日期和時間比較、節點和 QName 處理、序列處理、邏輯值等等。

XPath XSLT 中使用

XPath XSLT 標準中的主要元素。如果沒有 XPath 方面的知識,您就無法創建 XSLT 文檔。

您可以在我們的《XSLT 教程》中閱讀更多的內容。

XQuery XPointer 均構建于 XPath 表達式之上。XQuery 1.0 XPath 2.0 共享相同的數據模型,并支持相同的函數和運算符。

您可以在我們的《XQuery 教程》中閱讀更多有關 XQuery 的知識。

XPath W3C 標準

XPath 19991116 成為 W3C 標準。

XPath 被設計供 XSLTXPointer 以及其他 XML 解析軟件使用。

您可以在我們的《W3C 教程》中閱讀更多有關 XPath 標準的信息。

XPath 節點

XPath 中,有七種類型的節點:元素、屬性、文本、命名空間、處理指令、注釋以及文檔節點(或成為根節點)。

XPath 術語

節點(Node

XPath 中,有七種類型的節點:元素、屬性、文本、命名空間、處理指令、注釋以及文檔(根)節點。XML 文檔是被作為節點樹來對待的。樹的根被稱為文檔節點或者根節點。

請看下面這個 XML 文檔:

<?xml version="1.0" encoding="ISO-8859-1"?>

 <bookstore>

 <book>

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

 </bookstore>

上面的XML文檔中的節點例子:

<bookstore> (文檔節點)

<author>J K. Rowling</author> (元素節點)

lang="en" (屬性節點)

基本值(或稱原子值,Atomic value

基本值是無父或無子的節點。

基本值的例子:

J K. Rowling

"en"

項目(Item

項目是基本值或者節點。

節點關系

父(Parent

每個元素以及屬性都有一個父。

在下面的例子中,book 元素是 titleauthoryear 以及 price 元素的父:

<book>

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

子(Children

元素節點可有零個、一個或多個子。

在下面的例子中,titleauthoryear 以及 price 元素都是 book 元素的子:

<book>

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

同胞(Sibling

擁有相同的父的節點

在下面的例子中,titleauthoryear 以及 price 元素都是同胞:

<book>

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

先輩(Ancestor

某節點的父、父的父,等等。

在下面的例子中,title 元素的先輩是 book 元素和 bookstore 元素:

<bookstore>

 <book>

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

 </bookstore>

后代(Descendant

某個節點的子,子的子,等等。

在下面的例子中,bookstore的后代是 booktitleauthoryear 以及 price 元素:

<bookstore>

<book>

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

</bookstore>

XPath 語法

XPath 使用路徑表達式來選取 XML 文檔中的節點或節點集。節點是通過沿著路徑 (path) 或者步 (steps) 來選取的。

XML 實例文檔

我們將在下面的例子中使用這個 XML 文檔。

<?xml version="1.0" encoding="ISO-8859-1"?>

 <bookstore>

 <book>

  <title>Harry Potter</title>

  <price>29.99</price>

</book>

 <book>

  <title>Learning XML</title>

  <price>39.95</price>

</book>

 </bookstore>

選取節點

XPath 使用路徑表達式在 XML 文檔中選取節點。節點是通過沿著路徑或者 step 來選取的。

下面列出了最有用的路徑表達式:

表達式

描述

nodename

選取此節點的所有子節點

/

從根節點選取

//

從匹配選擇的當前節點選擇文檔中的節點,而不考慮它們的位置

.

選取當前節點

..

選取當前節點的父節點

@

選取屬性

實例

在下面的表格中,我們已列出了一些路徑表達式以及表達式的結果:

路徑表達式

結果

bookstore

選取 bookstore 元素的所有子節點

/bookstore

選取根元素 bookstore

注釋:假如路徑起始于正斜杠( / ),則此路徑始終代表到某元素的絕對路徑!

bookstore/book

選取所有屬于 bookstore 的子元素的 book 元素。

//book

選取所有 book 子元素,而不管它們在文檔中的位置。

bookstore//book

選擇所有屬于 bookstore 元素的后代的 book 元素,而不管它們位于 bookstore 之下的什么位置。

//@lang

選取所有名為 lang 的屬性。

謂語(Predicates

謂語用來查找某個特定的節點或者包含某個指定的值的節點。

謂語被嵌在方括號中。

實例

在下面的表格中,我們列出了帶有謂語的一些路徑表達式,以及表達式的結果:

路徑表達式

結果

/bookstore/book[1]

選取屬于 bookstore 子元素的第一個 book 元素。

/bookstore/book[last()]

選取屬于 bookstore 子元素的最后一個 book 元素。

/bookstore/book[last()-1]

選取屬于 bookstore 子元素的倒數第二個 book 元素。

/bookstore/book[position()<3]

選取最前面的兩個屬于 bookstore 元素的子元素的 book 元素。

//title[@lang]

選取所有擁有名為 lang 的屬性的 title 元素。

//title[@lang='eng']

選取所有 title 元素,且這些元素擁有值為 eng lang 屬性。

/bookstore/book[price>35.00]

選取所有 bookstore 元素的 book 元素,且其中的 price 元素的值須大于 35.00

/bookstore/book[price>35.00]/title

選取所有 bookstore 元素中的 book 元素的 title 元素,且其中的 price 元素的值須大于 35.00

選取未知節點

XPath 通配符可用來選取未知的 XML 元素。

通配符

描述

*

匹配任何元素節點

@*

匹配任何屬性節點

node()

匹配任何類型的節點

實例

在下面的表格中,我們列出了一些路徑表達式,以及這些表達式的結果:

路徑表達式

結果

/bookstore/*

選取 bookstore 元素的所有子節點

//*

選取文檔中的所有元素

//title[@*]

選取所有帶有屬性的 title 元素。

選取若干路徑

通過在路徑表達式中使用“|”運算符,您可以選取若干個路徑。

實例

在下面的表格中,我們列出了一些路徑表達式,以及這些表達式的結果:

路徑表達式

結果

//book/title | //book/price

選取所有 book 元素的 title price 元素。

//title | //price

選取所有文檔中的 title price 元素。

/bookstore/book/title | //price

選取所有屬于 bookstore 元素的 book 元素的 title 元素,以及文檔中所有的 price 元素。

XPath Axes(坐標軸)

XML 實例文檔

我們將在下面的例子中使用此 XML 文檔:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>

  <title>Harry Potter</title>

  <price>29.99</price>

</book>

<book>

  <title>Learning XML</title>

  <price>39.95</price>

</book>

 </bookstore>

XPath

軸可定義某個相對于當前節點的節點集。

軸名稱

結果

ancestor

選取當前節點的所有先輩(父、祖父等)

ancestor-or-self

選取當前節點的所有先輩(父、祖父等)以及當前節點本身

attribute

選取當前節點的所有屬性

child

選取當前節點的所有子元素。

descendant

選取當前節點的所有后代元素(子、孫等)。

descendant-or-self

選取當前節點的所有后代元素(子、孫等)以及當前節點本身。

following

選取文檔中當前節點的結束標簽之后的所有節點。

namespace

選取當前節點的所有命名空間節點

parent

選取當前節點的父節點。

preceding

選取文檔中當前節點的開始標簽之前的所有節點。

preceding-sibling

選取當前節點之前的所有同級節點。

self

選取當前節點。

位置路徑表達式

位置路徑可以是絕對的,也可以是相對的。

絕對路徑起始于正斜杠( / ),而相對路徑不會這樣。在兩種情況中,位置路徑均包括一個或多個步,每個步均被斜杠分割:

絕對位置路徑:

/step/step/...

相對位置路徑:

step/step/...

每個步均根據當前節點集之中的節點來進行計算。

步(step)包括:

軸(axis

定義所選節點與當前節點之間的樹關系

節點測試(node-test

識別某個軸內部的節點

零個或者更多謂語(predicate

更深入地提煉所選的節點集

步的語法:

軸名稱::節點測試[謂語]

實例

例子

結果

child::book

選取所有屬于當前節點的子元素的 book 節點

attribute::lang

選取當前節點的 lang 屬性

child::*

選取當前節點的所有子元素

attribute::*

選取當前節點的所有屬性

child::text()

選取當前節點的所有文本子節點

child::node()

選取當前節點的所有子節點

descendant::book

選取當前節點的所有 book 后代

ancestor::book

選擇當前節點的所有 book 先輩

ancestor-or-self::book

選取當前節點的所有book先輩以及當前節點(假如此節點是book節點的話)

child::*/child::price

選取當前節點的所有 price 孫。

XPath 運算符

XPath 表達式可返回節點集、字符串、邏輯值以及數字。

XPath 運算符

下面列出了可用在 XPath 表達式中的運算符:

運算符

描述

實例

返回值

|

計算兩個節點集

//book | //cd

返回所有帶有 book ck 元素的節點集

+

加法

6 + 4

10

-

減法

6 - 4

2

*

乘法

6 * 4

24

div

除法

8 div 4

2

=

等于

price=9.80

如果 price 9.80,則返回 true

如果 price 9.90,則返回 fasle

!=

不等于

price!=9.80

如果 price 9.90,則返回 true

如果 price 9.98,則返回 fasle

小于

price<9.80

如果price9.00,則返回true

如果price9.98,則返回fasle

<=

小于或等于

price<=9.80

如果 price 9.00,則返回 true

如果 price 9.90,則返回 fasle

大于

price>9.80

如果 price 9.90,則返回 true

如果 price 9.80,則返回 fasle

>=

大于或等于

price>=9.80

如果 price 9.90,則返回 true

如果 price 9.70,則返回 fasle

or

price=9.80 or price=9.70

如果 price 9.80,則返回 true

如果 price 9.50,則返回 fasle

and

price>9.00 and price<9.90

如果 price 9.80,則返回 true

如果 price 8.50,則返回 fasle

mod

計算除法的余數

5 mod 2

1

XPath 實例

在本節,讓我們通過實例來學習一些基礎的 XPath 語法。

XML實例文檔

我們將在下面的例子中使用這個 XML 文檔:

"books.xml" :

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book category="COOKING">

  <title>Everyday Italian</title>

  <author>Giada De Laurentiis</author>

  <year>2005</year>

  <price>30.00</price>

</book>

<book category="CHILDREN">

  <title>Harry Potter</title>

  <author>J K. Rowling</author>

  <year>2005</year>

  <price>29.99</price>

</book>

<book category="WEB">

  <title>XQuery Kick Start</title>

  <author>James McGovern</author>

  <author>Per Bothner</author>

  <author>Kurt Cagle</author>

  <author>James Linn</author>

  <author>Vaidyanathan Nagarajan</author>

  <year>2003</year>

  <price>49.99</price>

</book>

<book category="WEB">

  <title>Learning XML</title>

  <author>Erik T. Ray</author>

  <year>2003</year>

  <price>39.95</price>

</book>

</bookstore>

在您的瀏覽器中查看此 "books.xml" 文件

節點選取

我們將使用微軟的 XML DOM 對象來載入 XML 文檔,并使用 selectNodes() 函數從 XML 文檔選取節點:

set xmlDoc=CreateObject("Microsoft.XMLDOM")

xmlDoc.async="false"

xmlDoc.load("books.xml")

xmlDoc.selectNodes(路徑表達式)

選取所有的 book 節點

下面的這個例子選取了 bookstore 元素下所有的 book 節點:

xmlDoc.selectNodes("/bookstore/book")

假如您正在使用 IE 5 或更高的版本,可以親自試一試

選取第一個 book 節點

下面的例子僅選取 bookstore 元素下第一個 book 節點:

xmlDoc.selectNodes("/bookstore/book[0]")

假如您正在使用 IE 5或更高的版本,可以親自試一試

注釋:IE 5 6 會把 [0] 作為第一個節點來執行,但是根據 W3C 的標準,應該使用 [1] !!

注釋:這個問題在 IE 6 SP2 中被糾正了!

選取 price

下面的例子從所有的 price 節點選取文本:

xmlDoc.selectNodes("/bookstore/book/price/text()")

假如您正在使用 IE 5 或更高的版本,可以親自試一試

選取價格高于 35 price 價格

下面的例子會選取所有價格高于 35 price 節點:

xmlDoc.selectNodes("/bookstore/book[price>35]/price")

假如您正在使用 IE 5 或更高的版本,可以親自試一試

選取價格高于 35 title 節點

下面的例子會選取所有價格高于 35 title 節點:

xmlDoc.selectNodes("/bookstore/book[price>35]/title")

假如您正在使用 IE 5 或更高的版本,可以親自試一試

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!