Python爬蟲程式設計思想(46):使用Chrome驗證XPath

語言: CN / TW / HK

驗證XPath程式碼是否正確,並不一定要使用lxml以及其他解析庫,直接使用Chrome瀏覽器的開發者工具就可以搞定。

仍然拿京東商城為例,顯示首頁的開發者工具,然後定位到首頁導航條的“秒殺”程式碼的位置,並安裝上一節的方法複製該位置的XPath程式碼。然後在開發者工具中切換到Console選項卡,並輸入如下的程式碼:

$x('//*[@id="navitems-group1"]/li[1]/a')

其中$x是用來執行XPath的函式,引數需要指定XPath程式碼。如果XPath程式碼中包含的是雙引號,引數要使用單引號括起來,如果XPath程式碼中包含的單引號,引數要使用雙引號括起來。輸入完成後,按Enter鍵,如果XPath可以至少選擇一個節點,那麼在下方就是顯示這些節點,展開節點後,會看到節點中的各種屬性的值,如圖1所示。

上面的XPath程式碼用於選擇包含“秒殺”文字的<a>節點。從圖1所示的選擇結果可以看出,“秒殺”文字在<a>節點的innerHTML屬性和innerText屬性中。讀者在編寫或得到一行XPath程式碼時,可以用這種方式驗證XPath程式碼是否正確。